前へ 1 2 3 4 次へ

自社保有のデータセンター、HDDを100本搭載するサーバー、高速なファイル同期の秘密、AI時代の400Gbネットワーク……

【保存版】ファイル1兆個=470万テラバイト! 巨大クラウド・Dropboxのインフラを支える最新技術

文●大塚昭彦/TECH.ASCII.jp

提供: Dropbox

  • この記事をはてなブックマークに追加
  • 本文印刷

AI時代に向けて:新世代のGen 7サーバーへの更新をスタート

――話がずいぶん長くなってきたので、ここで話題を変えて。Dropboxの「これから」の技術についてもお聞きしたいのですが。

岡崎氏:それでは、公開しても差し支えのない範囲で説明しますね。

 まず、Dropboxが現在力を入れているサービスが、RAGやAIエージェントの技術を組み込んだ「Dropbox Dash」です。ユニバーサル検索ツールと呼ばれるもので、Dashの生成AIに質問すると、Dropboxにあるコンテンツだけでなく、メールやカレンダー、Webサイトなど、さまざまな情報を参照したうえで回答してくれます。

 このサービスを広く提供していくために、サーバー群をよりハイパフォーマンスな「Gen 7(第7世代)」シリーズに刷新しているところです。たとえば、ブロックの分割処理などを行うブロックサーバーは、Gen 6の48コアから84コアへ、メモリ容量は2倍(512GB)に、ネットワークも25Gbから100Gbに強化されています。また、ブロックストレージサーバーでは、将来の拡張性を見越して最大50TBまでのHDDに対応しており、200Gbのネットワークカードを搭載します。

新しいGen 7サーバーシリーズ

――AI処理といえばGPUサーバーが必須ですが、それもラインアップされていますね。

岡崎氏:はい、2種類あります。動画のトランスコーディング、エンベディングなど、比較的軽量な推論タスクを実行する「Gumby」と、最大8基のGPUを搭載できる大規模なAIタスク向けの「Godzilla」です。

――ゴジラ! 強そうな名前です(笑)。

AI/機械学習用のGPUも段階的に強化。2025年にはGPU専用サーバーの「Godzilla」が投入された

RAG+AIエージェント:ユニバーサル検索を簡単にするために

――Dashのソフトウェア部分では何か特徴がありますか。

岡崎氏:Dashでは、Dropbox以外のさまざまなデータソースから情報を取得して、回答を生成しなければなりません。データソース特定できる単純な質問ならばRAGで処理できますが、そうでない複雑な質問の場合はAIエージェントを使います。

 たとえば、ユーザーが「わたしのチームの、第1四半期の成果指標(OKR)達成状況は?」と質問するとします。このとき、「わたしのチーム」の情報は組織図(ディレクトリサービス)に、「成果指標」はDropbox上のドキュメントに、そして「達成状況」はタスク管理サービスに分散しています。Dashは、それぞれの情報がどこにありそうかを判断したうえで各サービスにアクセスし、個別に情報を収集したうえで、回答を生成することになります。

――言われてみると、たしかに複雑な処理ですね。

岡崎氏:ここで、複数ステップの処理を自律的に実行できるAIエージェントが活躍します。AIエージェントはまず、先ほどの質問に回答するための「プラン(計画)」を生成し、その計画に沿って各データソースから情報を収集し、回答を生成します。

 さらに、実際にサービスとして提供するためうえでは、こうした仕組みを構築するだけでは不十分です。簡単な質問には素早く(1~2秒以内で)回答する一方で、複雑な質問にはハルシネーションのない正確な回答を返す。また、できるだけ最新の情報に基づいて回答できるようにする必要もあります。そうした検証やチューニングも継続的に行って、より快適に使えるサービスになるよう改善を図っています。

この質問に回答するには、複数のデータソースから情報を収集しなければ回答できない

AIエージェントが自律的に「プラン(計画)」を立てたうえで、その計画に沿って実行していく

――今後もAI関連の機能は増えていくと思いますが、AIについても自社運用のサービス基盤を利用していく方針なんでしょうか。

岡崎氏:すべてではありませんが、コアの部分は自社でやっていく方針だと思います。ひとつは、お客様のデータを確実に保護するというセキュリティやプライバシーの観点から。もうひとつは、サービスのレイテンシ(応答速度)に関する問題ですね。やはり外部のサービスを使うとレイテンシが落ちますし、こちらではコントロール(改善)ができませんから。

――やっぱりここでも、“データのセキュリティ”や“使い勝手の良さ”は欠かせない要素として、重視しているわけですね。

* * *

 これ以外にも、岡崎氏の話は「PCアプリケーションの同期エンジンとアルゴリズム」「データセンターの省電力化や再生可能エネルギーの活用」など広範に及んだ。さすがにまとめきれないので記事はここまでにしたいが、こうした技術情報はどれもDropboxのテックブログ「Dropbox.Tech」で詳しく紹介されている。

 本記事で紹介した内容をさらに詳しく、専門的に理解したい読者は、以下にURLのリストを載せておくので、ぜひご一読いただきたい(一部は邦訳されている)。

■Dropboxのテックブログ「Dropbox.Tech」の関連記事
 ○データセンター/ゾーン
 ○データセンターの耐障害(フェイルオーバー)テスト
 ○Gen 6サーバー/HDD
 ○ネットワークファブリック
 ○400Gbネットワーク
 ○Gen 7サーバー
 ○Dropbox Dash/AIエージェント
 ○100%カーボンニュートラルデータセンター

今回の取材のために岡崎氏が作成してくれた、Dropbox設立からの技術進化年表(※サイズが巨大で文字が小さいため、拡大してご覧ください。3.6MB)

前へ 1 2 3 4 次へ

過去記事アーカイブ

2025年
01月
02月
03月
04月
05月
06月
07月
08月
09月
10月
2024年
01月
02月
03月
04月
05月
06月
07月
08月
09月
10月
11月
12月
2023年
01月
02月
03月
04月
05月
06月
07月
08月
09月
10月
11月
12月
2022年
01月
02月
03月
04月
05月
06月
07月
08月
09月
10月
11月
12月
2021年
03月
04月
05月
07月
08月
09月
10月
11月
12月
2020年
03月
06月
07月
08月
09月
10月
11月
2019年
03月
04月
06月
08月
10月
11月
2018年
01月
03月
05月
08月
11月
2017年
03月
10月
2016年
01月
04月
2015年
02月
04月
07月
10月
2014年
08月
11月
2013年
11月