このページの本文へ

開発の経緯や設計のポイントを徹底インタビュー

フラッシュを前提にしたネットアップ「FlashRay」のアーキテクチャ

2014年03月26日 06時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

ネットアップがまもなく市場に投入するオールフラッシュアレイ「FlashRay」はフラッシュを前提にソフトウェアをイチから作り直した渾身作だ。米ネットアップでFlashRayを担当するタイ・マッコーニー氏とブライアン・パウロウスキー氏に開発経緯やアーキテクチャについて聞いた。(インタビューア:TECH.ASCII.jp 大谷イビサ)

買収を選ばなかったFlashRayの開発

TECH 大谷:FlashRayの開発経緯を聞かせてください。フラッシュ前提にソフトウェアを新たに起こしたそうですが、なぜ他社製品を買収し、迅速に市場に投入する道を選ばなかったのですか?

タイ・マッコーニー氏:オールフラッシュアレイの開発に関しては、多くのスタートアップ企業を徹底的に調べ、実際6~7社くらいとはアーキテクチャレベルで議論を重ねてきたが、なんらかのギャップがあることがわかった。スケールアウト性や重複排除、固定長のブロックなどいろんなところで、技術の不足やアーキテクチャの限界があった。

米ネットアップ プロダクトオペレーションズ コーポレートヴァイスプレジデント タイ・マッコーニー氏

一方で、社内を見回すと、Data ONTAPやWAFL、NASの設計、重複排除の開発を手がけた優秀なエンジニアが数多く在籍していた。そこで、こうした人たちをまとめ、既存のData ONTAPのIPをフル活用し、次世代のアーキテクチャを開発する社内のスタートアップとして立ち上げることにした。こうしてできたのが、社内で「Mars」と呼ばれているFlashRayのプロジェクトだ。

TECH 大谷:次世代のアーキテクチャとは、フラッシュにフォーカスしているという意味でしょうか?

パウロウスキー氏:そうだ。ディスクの管理に大きな負荷がかかるハイブリッドではなく、まずはSSDにフォーカスし、性能を完全に解放する。これによってハイブリッドでは得られないパフォーマンスを得る。一方で、磨耗したり、耐久性に不安があるといったSSDの課題を解消する。この2つがデザインのキーポイントだ。

米ネットアップ プロダクトオペレーション シニアバイスプレジデント ブライアン・パウロウスキー氏

重要なのは、ハイブリッドはData ONTAPで行くという戦略的な決定だ。スピニングディスクとフラッシュをバランスよく活用するのは、あくまでDataONTAPが担うことになる。

SSD磨耗の根源を徹底的に排除する

TECH 大谷:実際にどのようにSSDの磨耗という課題を解決するのですか?

パウロウスキー氏:まずは磨耗の根源を徹底的に絶つ。SSDの磨耗は、データブロックの書き込み、削除、再配置など、ライトアンプリフィケーション(書き込みの増幅)の現象が原因だ。そのため、とにかくスタックを見直し、ライトを最適化した。例を3つ挙げよう。

まずは重複排除だ。DataONTAPはポストプロセスで重複排除を行なうが、FlashRayはインラインで重複排除を行なう。重複データを書き込まないので、クラスターには単一のデータブロックしか存在しない。

RAIDに関しても工夫している。DataONTAPには専用のパリティディスクとデータディスクがあり、WAFLがどれだけ両者のギャップを埋めようとしても、パリティディスクへの書き込みがどうしても多くなる。一方、FlashRayは分散パリティアルゴリズムを使い、すべてのディスクになるべく均等に書き込む。また、ログ構造のファイルシステムを持っているので、ブロック単位ではなく、フルストライドライトを行なっている。

さらに書き込みを減らすために可変長ブロックを採用している。4KB単位だと数多くのポインターを持たなければならないが、64KB単位であれば、1/16で済むだろう? 

TECH 大谷:FlashRayでは、メモリはどうやって使っているんですか? Data ONTAPは書き込みデータをNVRAMにキャッシュして、シーケンシャルに書き込んでいますが。

パウロウスキー氏:HDDとフラッシュの違いは、やはりスピードだ。HDDの場合、DRAMはキャッシュとして使われ、なるべくHDDでの接地頻度を少なくするようにしている。ディスクが遅いことを隠すためにいろいろ努力しているわけだ。一方、FlashRayは高速なSSDのサブシステムがあるので、メモリはポインタの保持に用いられ、とにかく1回の読み書きで済むようにしている。高速なSSDの邪魔にならないよう振る舞うのが、FlashRayでのメモリの位置づけだ。

TECH 大谷:Data ONTAPとはアーキテクチャがずいぶん異なるんですね。

パウロウスキー氏:もちろんDataONTAPと共通する部分もある。たとえば、シンプルなインストール、システム管理のインターフェイスなどはData ONTAPを引き継いでいる。また、APIもONTAPと共通になっており、パートナーの製品との連携もシンプルに行なえる。

新車と同じだ。パフォーマンスもよいし、さまざまな機能もついている。走行距離だって長い。一方で、ハンドルやブレーキはあるべきところにないと困るだろう?

ネットアップは3つ目の家もレンガ造り

TECH 大谷:次にFlashRayの用途に聞いてお聞かせください。オールフラッシュアレイの利用用途は、正直まだイメージしにくいのですが。

マッコーニー氏:現在はデータベースの高速化が多い。銀行であればトランザクションも、分析も高速化したいというニーズに応えられる。小売りであれば、購買分析やクレジットカードのチェックを迅速に行なえるよう、アプリケーションを加速できる。

かつては求めるパフォーマンスを得るために、ユーザーはシステムをディスクだらけにしてきた。しかし、オールフラッシュアレイであれば、はるかに小さいスペース、はるかに少ない電力で同じパフォーマンスを得ることができる。厳しい予算の中でも、確実にパフォーマンスを達成することが可能だ。

TECH 大谷:競合との差別化ポイントについて教えてください。スタートアップとの比較、あるいはIBM、HP、デルなど大手との差別化ポイントはどこでしょうか?

マッコーニー氏:スタートアップとの比較は、エンタープライズレベルの信頼性とグローバルでの展開だ。われわれは20年以上、エンタープライズの期待に応えてきたので、この部分はスタートアップは足下にも及ばない。一方、大手ベンダーとの差別化は、ポートフォリオだろう。われわれ専業ベンダーで、R&Dも優れたストレージ製品の開発にフォーカスしている。

市場を見回せば、わらや木で家を造っているベンダーも多い、ネットアップの製品はData ONTAPシリーズも、EFシリーズも、そして3つ目の家であるFlashRayもレンガ造りだ。風が吹いても、倒れない。

3つの製品ラインで包括的なデータ管理とパフォーマンスを実現

パウロウスキー氏:最近のストレージ製品は多機能で、複雑になっているので、機能の星取り表はいくらでも作れる。また、多くの製品はスナップショット、重複排除など基本的な機能を一通り持っている。重要なのは、こうした複数の要素を組み合わせ、全体で最適化を図っていくことだ。

一方で、デザインという観点では、たとえば可変長ブロックの採用などはユニークな点だろう。また、スケールアウトや重複排除はオールフラッシュアレイに限らず、必須の要件になるだろう。これらを後付けするのは、きわめて難しい。われわれもData ONTAPで散々苦労してきた(笑)。だから、FlashRayでは設計段階からこれらを取り込んだ。

TECH 大谷:今回FlashRayが加わることで、ネットアップはData ONTAPだけではなく複数のプラットフォームを抱えることになります。1つのOSでシンプルなアーキテクチャを実現すると言っていた過去の主張と矛盾しませんか?

パウロウスキー氏:私は7年間CTOを務めてきたが、単一のOSでシンプルになるなんて言ったことは一度もないぞ(笑)。複数のソフトウェアで重複する部分がある場合は、複雑になるので、整理した方がよいとは言ってきた。Data ONTAPとFlashRayはお互いに補完しあう立場になるし、管理面ではユーザーから見て同一にしていく。パートナーといっしょに最適なソリューションを顧客に提案していくことになる。

■関連サイト

カテゴリートップへ

  • 角川アスキー総合研究所
  • アスキーカード