このページの本文へ

前へ 1 2 次へ

スケールアウトNAS「アイシロン」のすべて 第4回

スケールアウトNASの特性を活かした新しい領域へ

アイシロンがビッグデータに最適な理由

2012年10月31日 09時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

従来、スケールアウトNASというとメディア関連や製造業など特定業種向けというイメージが強かった。しかし、昨今ではより汎用的な方向性を目指し、ビッグデータに最適なストレージを標榜している。

コンテンツ重視の特定分野からビッグデータの領域へ

 昨今、業務データやインターネットのデタをビジネスに活用しようというビッグデータ の時代が到来している。

 こうした状況に対し、アイシロンもビッグデータへの対応を積極的に進めている。そもそもアイシロンは、容量が膨大という意味では「ビッグデータのために生まれたストレージ」と言って間違いないだろう。ノードの追加だけで、簡単に容量と増やせる点しかり、データ容量が増えても高いパフォーマンスを確保できる点しかり、新モデルの入れ替えを無停止で手間なく行なえる点しかり、ビッグデータを扱うにあたって必須のスペックを完全に満たしている。そしてなにより重要なのが、データが増えても、ノードが増えても、管理の負荷は増えないことだ。このシンプルさが、ビッグデータを見越したストレージ選びで、もっとも重視される点と言える。

 そして、ビッグデータ対応という点でもっとも興味深いのはHadoopクラスターへの適用だ。Hadoopは、ペタバイトクラスのデータを高速に処理するための分散処理基盤で、グーグルやヤフーなど最大手のWeb事業者がこぞって採用している。また、従来のバッチ処理を大幅に高速化する技術として、一般企業での導入も相次いでいる。

図15 Hadoopのエンタープライズ利用を阻む要素

 とはいえ、Hadoopでは基本的に外部ストレージを必要としておらず、大量のサーバークラスターで処理するのが一般的だ。HadoopのファイルシステムであるHDFS(Hadoop Distributed File System)は、親に当たるネームノードと子に当たるデータノードに分けられる。データノードではサーバーの内蔵ディスクを複数ノードで仮想化し、1つの分散ファイルシステムとして扱う。つまり、システムの規模や処理能力を増強する場合は、そのままデータノードを追加すればよい。また、HDFSではデータを複数のホストにミラーする仕組みがあるため、基本的にRAIDのようなデータ保護の仕組みは必要ない。つまり、スケールアウトやデータ保護の仕組みは、Hadoopにすでに用意されているわけだ。なぜ、あえてアイシロンを導入した方がよいのだろうか?

 安価な汎用サーバーを大量に並べて分散処理させるという従来のHadoopシステムには、実はいくつもの「穴」がある。まず、Hadoopのネームノードはシングルノードのため、単一障害点になってしまう。つまり、障害時はジョブの内容が失われるほか、ダウンタイムが発生してしまうことになる。また、データ保護のための3面ミラーリングは、ディスクの利用効率も悪く、再構築中にはネットワークの帯域を大きく圧迫する。障害時からの復旧という面でも手間のかかる仕組みとなっているわけだ。

前へ 1 2 次へ

この連載の記事

週刊アスキー最新号

編集部のお勧め

ASCII倶楽部

ASCII.jp Focus

MITテクノロジーレビュー

  • 角川アスキー総合研究所
  • アスキーカード
ピックアップ

デジタル用語辞典

ASCII.jp RSS2.0 配信中