自社保有のデータセンター、HDDを100本搭載するサーバー、高速なファイル同期の秘密、AI時代の400Gbネットワーク……
【保存版】ファイル1兆個=470万テラバイト! 巨大クラウド・Dropboxのインフラを支える最新技術
提供: Dropbox
AI時代に向けて:新世代のGen 7サーバーへの更新をスタート
――話がずいぶん長くなってきたので、ここで話題を変えて。Dropboxの「これから」の技術についてもお聞きしたいのですが。
岡崎氏:それでは、公開しても差し支えのない範囲で説明しますね。
まず、Dropboxが現在力を入れているサービスが、RAGやAIエージェントの技術を組み込んだ「Dropbox Dash」です。ユニバーサル検索ツールと呼ばれるもので、Dashの生成AIに質問すると、Dropboxにあるコンテンツだけでなく、メールやカレンダー、Webサイトなど、さまざまな情報を参照したうえで回答してくれます。
このサービスを広く提供していくために、サーバー群をよりハイパフォーマンスな「Gen 7(第7世代)」シリーズに刷新しているところです。たとえば、ブロックの分割処理などを行うブロックサーバーは、Gen 6の48コアから84コアへ、メモリ容量は2倍(512GB)に、ネットワークも25Gbから100Gbに強化されています。また、ブロックストレージサーバーでは、将来の拡張性を見越して最大50TBまでのHDDに対応しており、200Gbのネットワークカードを搭載します。
――AI処理といえばGPUサーバーが必須ですが、それもラインアップされていますね。
岡崎氏:はい、2種類あります。動画のトランスコーディング、エンベディングなど、比較的軽量な推論タスクを実行する「Gumby」と、最大8基のGPUを搭載できる大規模なAIタスク向けの「Godzilla」です。
――ゴジラ! 強そうな名前です(笑)。
RAG+AIエージェント:ユニバーサル検索を簡単にするために
――Dashのソフトウェア部分では何か特徴がありますか。
岡崎氏:Dashでは、Dropbox以外のさまざまなデータソースから情報を取得して、回答を生成しなければなりません。データソース特定できる単純な質問ならばRAGで処理できますが、そうでない複雑な質問の場合はAIエージェントを使います。
たとえば、ユーザーが「わたしのチームの、第1四半期の成果指標(OKR)達成状況は?」と質問するとします。このとき、「わたしのチーム」の情報は組織図(ディレクトリサービス)に、「成果指標」はDropbox上のドキュメントに、そして「達成状況」はタスク管理サービスに分散しています。Dashは、それぞれの情報がどこにありそうかを判断したうえで各サービスにアクセスし、個別に情報を収集したうえで、回答を生成することになります。
――言われてみると、たしかに複雑な処理ですね。
岡崎氏:ここで、複数ステップの処理を自律的に実行できるAIエージェントが活躍します。AIエージェントはまず、先ほどの質問に回答するための「プラン(計画)」を生成し、その計画に沿って各データソースから情報を収集し、回答を生成します。
さらに、実際にサービスとして提供するためうえでは、こうした仕組みを構築するだけでは不十分です。簡単な質問には素早く(1~2秒以内で)回答する一方で、複雑な質問にはハルシネーションのない正確な回答を返す。また、できるだけ最新の情報に基づいて回答できるようにする必要もあります。そうした検証やチューニングも継続的に行って、より快適に使えるサービスになるよう改善を図っています。
――今後もAI関連の機能は増えていくと思いますが、AIについても自社運用のサービス基盤を利用していく方針なんでしょうか。
岡崎氏:すべてではありませんが、コアの部分は自社でやっていく方針だと思います。ひとつは、お客様のデータを確実に保護するというセキュリティやプライバシーの観点から。もうひとつは、サービスのレイテンシ(応答速度)に関する問題ですね。やはり外部のサービスを使うとレイテンシが落ちますし、こちらではコントロール(改善)ができませんから。
――やっぱりここでも、“データのセキュリティ”や“使い勝手の良さ”は欠かせない要素として、重視しているわけですね。
* * *
これ以外にも、岡崎氏の話は「PCアプリケーションの同期エンジンとアルゴリズム」「データセンターの省電力化や再生可能エネルギーの活用」など広範に及んだ。さすがにまとめきれないので記事はここまでにしたいが、こうした技術情報はどれもDropboxのテックブログ「Dropbox.Tech」で詳しく紹介されている。
本記事で紹介した内容をさらに詳しく、専門的に理解したい読者は、以下にURLのリストを載せておくので、ぜひご一読いただきたい(一部は邦訳されている)。
■Dropboxのテックブログ「Dropbox.Tech」の関連記事
○データセンター/ゾーン
○データセンターの耐障害(フェイルオーバー)テスト
○Gen 6サーバー/HDD
○ネットワークファブリック
○400Gbネットワーク
○Gen 7サーバー
○Dropbox Dash/AIエージェント
○100%カーボンニュートラルデータセンター
この記事の編集者は以下の記事もオススメしています
過去記事アーカイブ
- 2013年
- 11月





