データクラウドの中心にAIを据えるGoogle Cloudの戦略と「Google Cloud Next '24」の発表
BigQueryやLookerにもGeminiのパワーを ― Google Cloudデータ分析幹部に聞く
2024年04月24日 11時00分更新
Google Cloudは4月前半、米国ラスベガスで開催した「Google Cloud Next '24」において、AI/生成AIを中心とした多数の発表を行った。それはデータクラウド分野のデータウェアハウス「BigQuery」、BIの「Looker」なども例外ではない。
AIのパワーによって、データアナリティクスはどのように変わるのか。Google Cloudでデータおよび分析担当GM兼VPを務めるゲリット・カズマイヤー(Gerrit Kazmaier)氏に、同社の戦略と未来を聞いた。
――あなたはSAPでデータアナリティクスを統括した後、Google Cloudに入社されました。Google Cloudに移籍した動機を教えてください。
カズマイヤー氏:主に3つの理由がある。
1つ目として、SAPにはジュニアデベロッパーとして入社し、それからの11年間でデータアナリティクス、HANA、BIの取り組みを統括するプレジデントを経験することができた。ちょうど仕事と精神の両面で新しいことを求めていた。
2つ目は、これまでのキャリアを通じて常に「データ主導で価値を創出すること」に取り組んできたからだ。データの価値を解き放つことができる会社は世界にほんのわずかしかなく、Google Cloudは間違いなくその1社に入る。Googleにはデータ主導の価値観とマインドセットがあり、BigQueryやVertex AIなど、それを実現するための技術基盤を持っている。これを魅力に感じた。
3つ目は、Google Cloudを通じて、地球規模でテクノロジーを提供できるという可能性を持つことだ。わたしは次のトレンドは「データとAI」だと信じており、Google Cloudは論理的な選択だった。
――今年のGoogle Cloud Nextでもさまざまな発表がありました。データクラウド分野で主要なものを教えてください。
カズマイヤー氏:大きく、3つのカテゴリで強化を行った。
まず1つ目は、ポイントソリューションとしてのアナリティクスから「プラットフォームとしてのアナリティクス」への移行。具体的には、BigQueryを中心としたプラットフォームだ。複数のデータエンジンを使って単一のデータに対してガバナンスとセキュリティを効かせながら、リアルタイム・ストリーミング、データ・アドレス処理、構造化データと非構造化データの組み合わせなどができる。
ここでは、BigQuery向けの新しいKafkaサービス、BigQueryのデータストリーム向けSQLストリーミングエンジン、セマンティック検索やデータガバナンスなどを発表した。
2つ目はAIデータ基盤。現在の企業ではデータ戦略とAI戦略がバラバラであることが多く、そのためにデータをAIに活用する能力が制限されている。そこで、VertexAIとBigQueryをダイレクトに連携できるようにした。これでGeminiなどのモデルに直接アクセスできるようになり、非構造データ、画像などを処理できるようになる。
ここではまた、BigQueryにおけるベクトルインデックスのサポートも加えた。これによりセマンティック検索が可能になる。プレビューリリースでは多数の利用があった、期待の高い機能だ。
そして「Gemini in BigQuery」も発表した。Geminiモデルの能力をBigQueryにもたらすもので、コンテキストを理解してSQLの質問に答えてクエリを自動生成するなどのことが可能になる。これを我々は“常時オンのデータインテリジェンス”と呼んでいる。
同じくイベントで発表した「BigQuery Data Canvas」は、Gemini in BigQueryと連動しながら自然言語を使って、BigQuery内で複雑なデータ分析ができるデータエンジニア向けのエクスペリエンスとなる。
3つ目のカテゴリはBIだ。現在はダッシュボードやレポートを作成するためにはデータアナリストが必要であるため、なかなかBIの活用が広がらないという課題がある。そこで「Gemini in Looker」として、生成AI中心の体験をBIにもたらす。ユーザーは自然言語と使って求めるインサイトを得て、好みの形で表現することができる。
我々は、BIとAIが融合していくと考えている。
――「マルチモーダル」というトレンドは、データ分析やAIにどのような影響を与えるのでしょうか?
カズマイヤー氏:地球上にあるデータのうち、最大のものは文書、ビデオ、音声などの非構造データだ。たとえば「顧客との電話でのやり取り」「サプライヤーと交わした契約書」などがここに含まれる。全体の90%をこうした非構造データが占めるとも言われている。
これまで非構造データを扱うことは容易ではなかったが、大規模言語モデル(LLM)の登場により変わりつつある。Geminiはマルチモーダルをサポートし、BigQueryもマルチモーダルのデータを扱うことができるようになった。
ある顧客は、Vertex AIとBigQueryを使って取引所でのトレーダーの音声ファイルを分析することで、コンプライアンス対策、リアルタイムでの市場インサイト獲得などを行っている。また別の顧客は、ソーシャルチャネルや電子メールなどのリアルタイムデータから顧客の感情を抽出している。サプライチェーンのドキュメントからサプライチェーンの耐性を強化したり調達に役立てている顧客もある。
かつて「ビッグデータ」という言葉が流行したが、企業が最終的に欲しいのは「幅広いデータ」だ。会話、動画、ドキュメントなどビジネスが関係するもの全てを活用したいと思っている。ある顧客は、BigQueryにある営業データ、Salesforceにあるオポチュニティ(案件)データなど、顧客の行動を予測するための“シグナル”を集め、生成AIモデルを使って顧客ごとのカスタマージャーニーを構築している。これは、マルチモーダルだからこそ実現する使い方だ。
――「Snowflake」など、同様の機能を提供するサービスはほかにもあります。差別化ポイントはどこにあるのでしょうか?
カズマイヤー氏:データウェアハウス、データカタログ、AIシステムとポイントソリューションをバラバラに調達した場合、インテグレーション、データの移動、セキュリティ、品質、コスト、管理などの課題を考えなければならない。
我々は統一されたプラットフォームがあり、SQL、Spark、Pythonなどを同じデータのコピー、そしてAIに対して利用できる。ガバナンスもある。また、オープンな標準とフォーマットにコミットしており、Hudi、Delta、Icebargなどから選択できる。
価格性能比も差別化ポイントだ。独自のサーバーレスアーキテクチャを用いており、独立した調査機関の調査で、BigQueryは他の製品と比べてコストを最大54%抑えられることがわかった。
まとめると、BigQueryは豊富な機能があり、データからAIまでのライフサイクルをサポートし、TCOにも優れるということになる。
――今後の機能強化の方向性について教えてください。
カズマイヤー氏:企業は、AIですぐに利用できる“AIレディ”の大規模なデータ基盤の導入を進めている。この上でエージェントとしてAIアプリを構築するが、現在は人とアプリケーションにフォーカスしている。
次のステップは、エージェントが機械学習主導となり、我々の想像力の限界を超えて、考えもしなかったようなパターンを見つけて新しいビジネス価値に変えるようになることだ。Google Cloudとしても、それを支えるような機能を提供したい。