このページの本文へ

前へ 1 2 次へ

DSSDファウンダーに聞いたI/Oへのこだわり

フラッシュアレイ最高峰を目指したDSSD D5が生まれるまで

2016年06月28日 07時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

最大1000万IOPS、100GB/sのスループット、平均100マイクロ秒の遅延を実現するまさに怪物的なスペックを誇るラックスケールフラッシュアレイ「DSSD D5」。DSSDのファウンダーであるジェフ・ボンウィック氏にDSSDの開発経緯やテクノロジーについて聞く。

DSSD共同創立者兼CTO ジェフ ・ボンウィック氏

CPUは2万倍速くなっているのに、IOPSは10倍というギャップ

 今回インタビューしたDSSD CTOのジェフ・ボンウィック氏は、もともとサン・マイクロシステムズでZFSの開発を主導してきた人物で、2010年にアンディ・ベクトルシャイム氏とともに最高級のフラッシュアレイを作るべく、DSSDを立ち上げた。その後、2014年にEMCが製品開発中のDSSDを買収。2016年3月にいよいよ未曾有のパフォーマンスを誇るラックスケールフラッシュ「DSSD D5」が登場した。

 DSSDが目指したのは、CPUの計算速度に追いつくI/Oのパフォーマンスを実現することだ。ボンウィック氏は、「フラッシュが使われ始めた頃、多くの人はそのパフォーマンスに驚いた。同時に、フラッシュのパフォーマンスをどうやれば引き出せるかをみんな考えた」と語る。

 コンピューターの処理は、計算速度とデータのI/Oを両面で考えなければならない。1980年代と比較すると、CPUに関しては約2万倍高速になっているが、I/Oに関してはそこまで大きな伸びが見られないという事実がある。「キャパシティは10万倍になっているが、帯域は100倍、IOPSは10倍しか伸びていない。HDDはディスクアームが1つしかないので、IOPSには限界がある」とボンウィック氏は指摘する。もちろん、帯域に関しても問題があり、セクタあたりの密度を増やしても、帯域が拡大しなければ、性能はリニアに拡大しない。

CPUの性能向上に対して、ストレージのI/Oは伸び悩んでいる

 高速なフラッシュの登場はこうしたI/Oの問題を一気に解消する潜在能力を秘めていた。実際、2010年に同社が入手したNANDのスペックを見ると、メディアのアクセスタイミングは100マイクロ秒未満に抑えられており、IOPSは10万を実現していた。「32KBリードであれば、320MB/sを実現できるため、512のNANDチップを搭載したSSDであれば、計算上は160GB/sというスループットが可能になる」(ボンウィック氏)と見込まれた。しかし、実際はこの1%しか達成されなかったという。なぜだろうか? 

NANDの性能を引き出せないのはなぜか?

フラッシュの本来の性能を引き出せないのはなぜか?

 ボンウィック氏は、いくつかの制限を指摘する。まずはピーク時の電力と冷却に問題があり、DSSDのフォームファクタで限界があったのが1つ。また、帯域の問題も大きかった。通常、8~16のNANDダイで1つのフラッシュチャネルを共有するため、NANDダイごとで320MB/sのIOPSでも、トータルでは400MB/sにしかならなかったという。さらにフラッシュのコントローラーもSASインターフェイスで接続する限り、NANDを複数束ねてもSASの1.5GB/sが最高値となってしまう。ボトルネックにだらけで、スループットにつながらないのが大きな問題だった。

フラッシュのパフォーマンスを阻害する要因

 フラッシュの性能を引き出すため、DSSDでは2つのアプローチを考えた。1つはHDDをSSDに置き換えたハイブリッドやオールフラッシュアレイだ。こちらはRAIDや高可用性などエンタープライズのストレージの機能を提供でき、導入や利用も容易だが、ネットワークやI/Oのボトルネックが課題になる。もう1つがPCIeのフラッシュをサーバーに直結する方法だ。こちらはホスト自体にフラッシュを差し込んでしまうため、パフォーマンスは高い。しかし、サーバー間でデータを共有できず、高可用性やスケーラビリティを満たすことができないという。

 そこで、両者をいいとこどりした新しいラックスケールフラッシュという概念が生まれた。オールフラッシュアレイのようにフラッシュを外付けにし、クライアントから共有できるようにした上で、RAIDやデュアルポートなどにも対応した。一方で、PCIeでサーバーとフラッシュを直結することで、レガシーのSCSIプロトコルに依存しないようにした。さらに強力なデータ保護、NAND単位の管理や同時利用(コンカレンシ)などを追加し、エンタープライズでの利用に耐えうる機能を実装することにしたという。

サーバー直結型フラッシュとオールフラッシュアレイのいいとこどりをしたラックスケールフラッシュ

 こうしたDSSDのベーシックなハードウェアデザインは、I/OのほとんどをPCIe上で行なうというものだ。クライアントからCPUへの論理的なリクエスト、CPUからフラッシュへの物理的なリクエスト、そしてフラッシュからクライアントへのデータ転送(DMA)をすべてPCIeスイッチ経由で行なう。そして、このうちデータ転送はCPUを一切介さず、すべてカットスルーラリーで行なわれるため、遅延はきわめて小さい。このベーシックデザインを元に、48個のクライアントポートと36個のフラッシュモジュール、4つの物理CPUをフルメッシュ状に接続した巨大なPCIeのファブリックがDSSD D5のバックプレーンになる。

各コンポーネントをフルメッシュ接続したPCIeスイッチのファブリック

前へ 1 2 次へ

カテゴリートップへ

アクセスランキング

  1. 1位

    データセンター

    首都圏のデータセンター枯渇、電力コストの高騰、エンジニア不足 課題から考える最新データセンター選び

  2. 2位

    デジタル

    なぜ大企業でkintoneの導入が増えているのか? DX推進と「脱・属人化」を実現するエンプラパートナーに聞いた

  3. 3位

    TECH

    【提言】「VPNの安全性」が通用しない時代 ZTNAへの困難な移行を経営層はサポートせよ

  4. 4位

    ITトピック

    “VMwareショック”余波、IaaSベンダー撤退も/本音は「拒否したい」時間外の業務連絡/IT部門のデータメンテ疲れの声、ほか

  5. 5位

    データセンター

    「NVIDIA Blackwell GPU」約1100基搭載のAIインフラが稼働 さくらインターネットが石狩DC内で

  6. 6位

    デジタル

    kintoneの大企業売上は間もなく3割に サイボウズはグローバルで“戦える”新サービスも開発中

  7. 7位

    ITトピック

    生成AIなしでは仕事できない? 会社員7割が“AI依存”自覚/「年内にAIエージェントが成果生む」CEOの9割が確信、ほか

  8. 8位

    Team Leaders

    ランサムウェア攻撃になぜ強い? Boxが「コンテンツセキュリティ」と「AIリスク対策」を解説

  9. 9位

    TECH

    Claude Code×Opus 4.6で実現、1人で回せるAI開発チームの作り方

  10. 10位

    sponsored

    人手不足のIT運用部門、その課題をOC1のデータセンター運用支援サービスが解決する

集計期間:
2026年02月28日~2026年03月06日
  • 角川アスキー総合研究所