スケールアウトNASの特性を活かした新しい領域へ
アイシロンがビッグデータに最適な理由
2012年10月31日 09時00分更新
従来、スケールアウトNASというとメディア関連や製造業など特定業種向けというイメージが強かった。しかし、昨今ではより汎用的な方向性を目指し、ビッグデータに最適なストレージを標榜している。
コンテンツ重視の特定分野からビッグデータの領域へ
昨今、業務データやインターネットのデタをビジネスに活用しようというビッグデータ の時代が到来している。
こうした状況に対し、アイシロンもビッグデータへの対応を積極的に進めている。そもそもアイシロンは、容量が膨大という意味では「ビッグデータのために生まれたストレージ」と言って間違いないだろう。ノードの追加だけで、簡単に容量と増やせる点しかり、データ容量が増えても高いパフォーマンスを確保できる点しかり、新モデルの入れ替えを無停止で手間なく行なえる点しかり、ビッグデータを扱うにあたって必須のスペックを完全に満たしている。そしてなにより重要なのが、データが増えても、ノードが増えても、管理の負荷は増えないことだ。このシンプルさが、ビッグデータを見越したストレージ選びで、もっとも重視される点と言える。
そして、ビッグデータ対応という点でもっとも興味深いのはHadoopクラスターへの適用だ。Hadoopは、ペタバイトクラスのデータを高速に処理するための分散処理基盤で、グーグルやヤフーなど最大手のWeb事業者がこぞって採用している。また、従来のバッチ処理を大幅に高速化する技術として、一般企業での導入も相次いでいる。
とはいえ、Hadoopでは基本的に外部ストレージを必要としておらず、大量のサーバークラスターで処理するのが一般的だ。HadoopのファイルシステムであるHDFS(Hadoop Distributed File System)は、親に当たるネームノードと子に当たるデータノードに分けられる。データノードではサーバーの内蔵ディスクを複数ノードで仮想化し、1つの分散ファイルシステムとして扱う。つまり、システムの規模や処理能力を増強する場合は、そのままデータノードを追加すればよい。また、HDFSではデータを複数のホストにミラーする仕組みがあるため、基本的にRAIDのようなデータ保護の仕組みは必要ない。つまり、スケールアウトやデータ保護の仕組みは、Hadoopにすでに用意されているわけだ。なぜ、あえてアイシロンを導入した方がよいのだろうか?
安価な汎用サーバーを大量に並べて分散処理させるという従来のHadoopシステムには、実はいくつもの「穴」がある。まず、Hadoopのネームノードはシングルノードのため、単一障害点になってしまう。つまり、障害時はジョブの内容が失われるほか、ダウンタイムが発生してしまうことになる。また、データ保護のための3面ミラーリングは、ディスクの利用効率も悪く、再構築中にはネットワークの帯域を大きく圧迫する。障害時からの復旧という面でも手間のかかる仕組みとなっているわけだ。
この連載の記事
-
第5回
デジタル
アイシロンが狙うエンタープライズスケールアウト市場 -
第3回
デジタル
アイシロンのマイグレーションコストの秘密に迫る -
第2回
デジタル
実効容量とTCOで見るアイシロンのお得度 -
第1回
デジタル
従来型NASの限界を打ち破るアイシロン -
デジタル
スケールアウトNAS「アイシロン」のすべて - この連載の一覧へ