データクラウドの中心にAIを据えるGoogle Cloudの戦略と「Google Cloud Next '24」の発表

BigQueryやLookerにもGeminiのパワーを ― Google Cloudデータ分析幹部に聞く

2024年04月24日 11時00分更新

文● 末岡洋子　編集● 大塚／TECH.ASCII.jp

　Google Cloudは4月前半、米国ラスベガスで開催した「Google Cloud Next '24」において、AI／生成AIを中心とした多数の発表を行った。それはデータクラウド分野のデータウェアハウス「BigQuery」、BIの「Looker」なども例外ではない。

　AIのパワーによって、データアナリティクスはどのように変わるのか。Google Cloudでデータおよび分析担当GM兼VPを務めるゲリット・カズマイヤー（Gerrit Kazmaier）氏に、同社の戦略と未来を聞いた。

Google Cloud データおよび分析担当 GM 兼 VPのゲリット・カズマイヤー（Gerrit Kazmaier）氏

――あなたはSAPでデータアナリティクスを統括した後、Google Cloudに入社されました。Google Cloudに移籍した動機を教えてください。

カズマイヤー氏：主に3つの理由がある。

　1つ目として、SAPにはジュニアデベロッパーとして入社し、それからの11年間でデータアナリティクス、HANA、BIの取り組みを統括するプレジデントを経験することができた。ちょうど仕事と精神の両面で新しいことを求めていた。

　2つ目は、これまでのキャリアを通じて常に「データ主導で価値を創出すること」に取り組んできたからだ。データの価値を解き放つことができる会社は世界にほんのわずかしかなく、Google Cloudは間違いなくその1社に入る。Googleにはデータ主導の価値観とマインドセットがあり、BigQueryやVertex AIなど、それを実現するための技術基盤を持っている。これを魅力に感じた。

　3つ目は、Google Cloudを通じて、地球規模でテクノロジーを提供できるという可能性を持つことだ。わたしは次のトレンドは「データとAI」だと信じており、Google Cloudは論理的な選択だった。

――今年のGoogle Cloud Nextでもさまざまな発表がありました。データクラウド分野で主要なものを教えてください。

カズマイヤー氏：大きく、3つのカテゴリで強化を行った。

「Google Cloud Next」におけるデータクラウド分野での発表内容

　まず1つ目は、ポイントソリューションとしてのアナリティクスから「プラットフォームとしてのアナリティクス」への移行。具体的には、BigQueryを中心としたプラットフォームだ。複数のデータエンジンを使って単一のデータに対してガバナンスとセキュリティを効かせながら、リアルタイム・ストリーミング、データ・アドレス処理、構造化データと非構造化データの組み合わせなどができる。

　ここでは、BigQuery向けの新しいKafkaサービス、BigQueryのデータストリーム向けSQLストリーミングエンジン、セマンティック検索やデータガバナンスなどを発表した。

　2つ目はAIデータ基盤。現在の企業ではデータ戦略とAI戦略がバラバラであることが多く、そのためにデータをAIに活用する能力が制限されている。そこで、VertexAIとBigQueryをダイレクトに連携できるようにした。これでGeminiなどのモデルに直接アクセスできるようになり、非構造データ、画像などを処理できるようになる。

　ここではまた、BigQueryにおけるベクトルインデックスのサポートも加えた。これによりセマンティック検索が可能になる。プレビューリリースでは多数の利用があった、期待の高い機能だ。

　そして「Gemini in BigQuery」も発表した。Geminiモデルの能力をBigQueryにもたらすもので、コンテキストを理解してSQLの質問に答えてクエリを自動生成するなどのことが可能になる。これを我々は“常時オンのデータインテリジェンス”と呼んでいる。

　同じくイベントで発表した「BigQuery Data Canvas」は、Gemini in BigQueryと連動しながら自然言語を使って、BigQuery内で複雑なデータ分析ができるデータエンジニア向けのエクスペリエンスとなる。

　3つ目のカテゴリはBIだ。現在はダッシュボードやレポートを作成するためにはデータアナリストが必要であるため、なかなかBIの活用が広がらないという課題がある。そこで「Gemini in Looker」として、生成AI中心の体験をBIにもたらす。ユーザーは自然言語と使って求めるインサイトを得て、好みの形で表現することができる。

　我々は、BIとAIが融合していくと考えている。

――「マルチモーダル」というトレンドは、データ分析やAIにどのような影響を与えるのでしょうか？

カズマイヤー氏：地球上にあるデータのうち、最大のものは文書、ビデオ、音声などの非構造データだ。たとえば「顧客との電話でのやり取り」「サプライヤーと交わした契約書」などがここに含まれる。全体の90％をこうした非構造データが占めるとも言われている。

　これまで非構造データを扱うことは容易ではなかったが、大規模言語モデル（LLM）の登場により変わりつつある。Geminiはマルチモーダルをサポートし、BigQueryもマルチモーダルのデータを扱うことができるようになった。

　ある顧客は、Vertex AIとBigQueryを使って取引所でのトレーダーの音声ファイルを分析することで、コンプライアンス対策、リアルタイムでの市場インサイト獲得などを行っている。また別の顧客は、ソーシャルチャネルや電子メールなどのリアルタイムデータから顧客の感情を抽出している。サプライチェーンのドキュメントからサプライチェーンの耐性を強化したり調達に役立てている顧客もある。

　かつて「ビッグデータ」という言葉が流行したが、企業が最終的に欲しいのは「幅広いデータ」だ。会話、動画、ドキュメントなどビジネスが関係するもの全てを活用したいと思っている。ある顧客は、BigQueryにある営業データ、Salesforceにあるオポチュニティ（案件）データなど、顧客の行動を予測するための“シグナル”を集め、生成AIモデルを使って顧客ごとのカスタマージャーニーを構築している。これは、マルチモーダルだからこそ実現する使い方だ。

Google Cloud Nextの基調講演では、BigQuery、Looker、Vertexを使って構築したカスタムアプリケーションのライブデモが披露された。「クラウドスニーカー（ブランド名）の売上状況に基づいて、顧客セグメントと地域のヒートマップを作成」と自然言語で指示すると、Lookerのセマンティックレイヤーを使って結果が表示された