前へ 1 2 次へ

データ/AI領域の新発表、BigQueryは「AI対応の統合データ基盤」への進化

「Gemini in BigQuery」「Spanner Graph」など、Google Cloudが多数の新機能を発表

文●大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

新発表のひとつである「Gemini in BigQuery」。BigQuery上で、生成AI(Gemini)が自然言語のプロンプトからSQL文を生成する様子

 Google Cloudは2024年8月2日、データベースやデータレイクハウス、アナリティクス、AI/ML、BIといった同社“Data Cloud”領域のサービスについて、多数の新発表を行った。

 メディア向けの説明会では、AIおよびデータ分析関連の新発表をプラットフォーム&テクニカル インフラストラクチャ VP兼GMのブラッド・カルダー氏が、データベース関連の新発表をデータベース VP兼GMのアンディ・ガットマンズ氏が、それぞれ紹介した。

 本記事では「生成AI」「モダナイズ」「開発者」という3分類で、主な新発表をまとめる。なお、今回の新発表には一般提供開始(GA)となったもの、プレビューリリース段階のものが混在している点にはご留意いただきたい。

Google Cloud プラットフォーム&テクニカル インフラストラクチャ VP兼GMのブラッド・カルダー(Brad Calder)氏、同 データベース VP兼GMのアンディ・ガットマンズ(Andi Gutmans)氏

生成AI:「Gemini in BigQuery」ノートブックの利用も自然言語で支援

生成AIに関連する新発表の一覧(Google Cloud資料より抜粋)

 生成AI領域の新発表としてはまず、生成AI(LLM)のGeminiの能力をBigQueryに組み込む「Gemini in BigQuery」がある。SQLやPythonのコード生成/補完、データのインサイト、データキャンバス、データプレパレーション、またパーティショニング/クラスタリングに関する推奨事項の提案などを生成AIが行う。

 このうちデータキャンバスは、Geminiのサポートによって、自然言語を使ってデータの探索や可視化、モデリング、分析が可能になる機能だ。カルダー氏は「ノートブックの新たなエクスペリエンスを実現する」と語る。

 また、データのクレンジング、変換、プレパレーションについても、Geminiが支援する機能が備わる。「たとえば欠損値を推論したり、データのクレンジングとキュレーションを推奨したり、データパイプラインのオーケストレーションをサポートしたりすることができる。これによりパフォーマンスの向上とエラーの削減、コストの削減が実現する」(カルダー氏)。

データキャンバスの概要

データプレパレーションの概要

 なおBIツールのLookerでも同様に、Geminiによる支援機能を組み込む「Gemini in Looker」が発表されている。こちらでは「スライドの自動生成」「ビジュアライゼーションアシスタント」「数式アシスタント」「LookMLアシスタント」といった機能が実装されている。

 カルダー氏は「生成AIによって、従来のBIとデータ分析は『データエージェント』に置き換わるだろう」と予測する。Gemini in Lookerでは今後、会話型データ分析機能も予定していると述べた。

データ分析やBIを生成AIが支援する「Gemini in Looker」も発表

カルダー氏は、従来のBIは「生成AIによるデータエージェント」に進化していくとの予測を示した

生成AI:BigQueryを「AI対応の統合データ基盤」に進化させる機能強化

 また、BigQueryを「AI対応の統合データ基盤」に進化させるための機能強化として、BigLakeエンジンにおけるオープンフォーマット(Apache Iceberg、Delta Lake、Apache Hudi)への対応、さらにオープンソースのストリーミング/データ処理エンジン(Apache Kafka、Apache Spark)のサポートが発表されている。

 これらの発表についてカルダー氏は、BigQueryが「構造化データと非構造化データ、オープンフォーマットをシームレスにサポートし、ユーザーに統制されたアクセスを提供する単一のマルチモーダルなデータ基盤を実現する。さらにこの基盤で、リアルタイムデータの活用や、限りなくデータに近い場所での大規模データ処理も可能にする」と説明する。

Google Cloudが提供する“Data Cloud”の全体像。「AI対応の統合データ基盤」を目指したBigQueryの強化を進めている

 BigQueryにあるさまざまな企業データをVertex AIの生成AIモデルで処理できるよう、BigQueryからVertex AIへの直接アクセス機能も発表された。その活用例としてカルダー氏は、構造データと非構造データ(ドキュメント、ビデオ、画像など)を生成AIがシームレスに処理、分析できるとした。

生成AI:「Spanner Graph」拡張性の高い分散グラフデータベース

 スケーラブルな分散データベースサービスのSpannerでは、グラフデータベース(グラフDB)に対応する「Spanner Graph」が発表された。グラフDB用の標準クエリ言語であるGQLをサポートするとともに、GQLをリレーショナルDB用のSQLとも併用できるため、「データサイロが解消される」としている。また、Spannerへの全文検索機能、ベクトル検索機能の追加も発表された。

 ガットマンズ氏は、こうした機能強化によってSpannerがマルチモデルデータベースに進化したとアピールし、「コンテクストに対応したスマートなアプリケーション」が構築できると説明し、ユースケースの差別化に役立つと語った。

Spanner Graphにより、リレーショナルDBの世界とグラフDBの世界を統合すると紹介(画像は公式ブログより

GQL(グラフクエリ)とSQLを統合したクエリ文の例

前へ 1 2 次へ

過去記事アーカイブ

2024年
04月
05月
06月
07月
08月
09月
10月
12月
2023年
01月
02月
03月
05月
06月
07月
09月
12月
2022年
03月
04月
05月
06月
07月
08月
12月
2021年
02月
04月
05月
06月
08月
09月
10月
11月
2020年
05月
06月
2019年
04月
11月
2018年
07月
09月
10月
2017年
06月
2014年
07月