「Google I/O 2023」で発表された新製品/新機能を紹介
「PaLM 2」などの生成AIを搭載した最新製品、Google Cloudが説明
グーグル・クラウド・ジャパン(Google Cloud)は2023年5月17日、米Googleが5月に開催した開発者向け年次イベント「Google I/O 2023」において発表された、ジェネレーティブAI(生成AI)関連のクラウドサービスについて説明を行った。Google I/O 2023では、次世代言語モデル「PaLM 2」を搭載した25以上の製品や新機能が発表されている。
新たな言語生成モデル「PaLM 2」を生産性向上支援機能として組み込み
Google I/O 2023において、Googleのスンダー・ピチャイCEOは「2016年に“AIファースト”の企業としての歩みを開始して以降、Googleでは様々なサービスに対してAIを搭載し、人やコミュニティの役に立つようにしてきた。ジェネレーティブAIによって、この取り組みが次のステップに進む。大胆かつ責任あるアプローチによって、検索を含むすべてのコア製品を進化させていく」と語った。
Googleでは、2015年に高速/大規模な機械学習を実行できる専用チップ「Google TPU」を、また2017年には大規模データセットの学習が可能になる「Transformer」を発表。2018年には、それらを活用して大規模言語モデル「BERT」を生み出した。BERTを利用することで、文章の要約/応答/翻訳といったタスクの自動化が可能になり、生成AI分野をリードする企業の1社となった。さらに2020年には、会話データで学習した大規模言語モデル「LaMDA」も発表。2023年2月には、会話型AIサービスである「Bard」の試験運用を開始している。
今回のGoogle I/O 2023では、新たな言語モデルとしてPaLM 2を発表し、Bardに搭載したことも明らかにしている。
PaLM 2は、日本語を含む100以上の言語に渡る多言語対応の言語生成モデルで、慣用句や詩、なぞなぞなど、言葉に含まれるニュアンスも理解しながら文章を生成するという。また数式を含む化学論文なども学習しており、ロジックに基づく推論もできる。さらに、PythonやJavaScriptなどのプログラミング言語でコードを生成することも可能だ。
PaLM 2は、Google CloudのAPIとして利用できるほか、人間の生産性向上をサポートする“Duet AI”として、Googleの各種サービスにも組み込まれている。Google Cloudの寳野雄太氏は、「開発者からビジネスユーザーまで、Google Cloudでは働き方の変革を、AIの力で支援していく。その考え方の中心にあるのは、技術ではなく人だ」と説明した。
なおPaLM 2では、モデルサイズの異なる「Gecko」「Otter」「Bison」「Unicorn」がラインアップされており、用途やタスクに合わせて必要なモデルを選択できるのが特徴だ。たとえば非常に軽量なGeckoは、モバイルやエッジのデバイス上でも動作し、オフライン状態でもインタラクティブな応答ができるアプリケーションを実現する。
エンタープライズ分野で想定される、ジェネレーティブAIのユースケースも紹介された。コールセンターや顧客接点における「会話」、複雑なデータの探索を自然言語によるやり取りで支援する「検索」、コードの自動生成や対話によるアプリ開発の半自動化といった「クリエイティビティ」の3つが、主なユースケースとして想定されている。
寳野氏は、エンタープライズ分野では入力データの追加学習の制限、コストコントロール、既存アプリケーションとの統合、さらに企業倫理に沿った「責任あるAI」などのニーズが高いと説明。「そこで、コンシューマ向けにはBardを提供する一方、法人向けにはVertex AIをはじめとするソリューション群を提供している。PaLM 2はVertex AIの一部として、エンタープライズ機能を備えながら提供する」と語った。
ビジネスユーザー向け:欲しい文章や画像を自動生成してくれる
今回の説明会では、Google I/O 2023で発表した新たな製品を含め、Google Cloudが提供するジェネレーティブAIのポートフォリオも紹介した。
Duet AIは、Google Cloudが提供するあらゆるサービスにおいて、ビジネスユーザー、開発者、AI専門家などの人間と協調しながら生産性を向上させる。現在は、様々なユーザーのコラボレーションによる生産性を高める「Duet AI for Workspace」、チャットでアプリ開発を支援し、ビジネスユーザー主導でデジタル化を推進する「Duet AI for AppSheet」、コードを自動生成して開発者を支援する「Duet AI for Google Cloud」を提供している。
さらに「Contact Center AI」では、ジェネレーティブAIを組み込んで、コールセンターでの自動応答を実現しているという。ユーザー事例として紹介したのが、ハンバーガーチェーンのウェンディーズでだ。同社はドライブスルーの注文受付にジェネレーティブAIを活用した「フレッシュAI」を導入、チャットボットによる自動対応を実現している。独自のチューニングも施しており、たとえば常連客が「ジュニアベーコンチーズバーガー」を「JBC」と略して注文しても、正しく理解できるという。
ビジネスユーザー向けとしては、先に触れたDuet AI for Workspaceがある。
Duet AI for WorkspaceのジェネレーティブAIを活用することで、たとえばメールスレッドの要約や文章作成支援、翻訳支援、議事録の自動作成機能などを実装できる。さらにはイメージの作成、データ分類、データ分析といった機能の追加も考えられる。
3月からプライベートプレビュー版を提供している「Help me write」は、GmailやGoogleドキュメントにおいて、書きたい文章のトピックを数単語入力するだけでドラフトが自動生成される。これにより、多くの人が苦労する提案書やメールの返信の書き出し部分をサポとするという。また、生成したドラフトの「トーン」も、相手に合わせてワンクリックで変更することができる。スマートフォンに書きためたメモを、議事録として書き換えてくれる機能も備える。
さらに今回、Googleスライド向けの「Help me Visualize」が新たに発表された。こちらは、欲しい画像の説明を数単語入力するだけで画像を自動生成してくれる。またGoogleスプレッドシート向けには「Help me Organize」が発表されており、スプレッドシート内のデータを分析したり、テーブルやグラフなどを簡単にビジュアル化したりできる。GoogleドキュメントのHelp me writeは「スマートキャンバス」が連携し、Google Workspace上のあらゆる情報を集約できるようになっている。
また、Duet AI for AppSheetでは、コードをまったく書かず自然言語でGoogle Chatの連携アプリを作成することが可能だ。ワークフローの自動化や申請プロセスの簡略化、アラートのリアルタイムの共有などもGoogle Chatに一元化できる。Google Cloudの中之薗朔氏は、「WebhookやAPIなどの技術的な知識を持たない非エンジニアでも、Google Chatとの連携アプリを作成でき、市民開発の適用範囲を広げることができる」と述べた。
データサイエンティスト/開発者向け:Vertex AIを生成AI向けに拡張
データサイエンティストや機械学習エンジニア向けに、ジェネレーティブAIの基盤モデルやAPIの提供から、調整までのエンドトゥエンドでサポートを行う「Generative AI support in Vertex AI」と、開発者向けにジェネレーティブAIを活用したアプリ開発を支援し、ユースケースを簡単に実現する「Generative AI App Builder」についても説明した。
Generative AI support in Vertex AIは、従来から提供しているエンドトゥエンドの機械学習プラットフォーム「Vertex AI」を、ジェネレーティブAIに対応するかたちで機能拡張したものだ。基盤モデルの管理をはじめ、チューニング、カスタマイズ、APIアクセスなどを統合する「Vertex AI Model Garden」と、基盤モデルに対してプロンプトエンジニアリングやチューニングを行う「Generative AI Studio」、そしてPaLM 2をエンタープライズ用途に適用するための「PaLM for Text and Chat」で構成される。いずれも現在はパブリックプレビューとして提供している。
テキストやチャット以外にも対応している。シンプルなテキストプロンプトで画像の生成や編集が行える「Image for Text-to-Image」、テキストから20以上のプログラミング言語でコードが生成できる「Codey for Text-to-Code」、100以上の言語をサポートする音声認識モデル「Chirp for Speech to Text」が紹介された。
なおVertex AIにおいて、人間のフィードバックを利用してモデルの有用性を高められる「Reinforcement learning from human feedback(RLHF)」をサポートしており、基盤モデルの改善と人間中心のジェネレーティブAIを実現するとした。
現在プライベートプレビューのGenerative AI App Builderでは、基盤モデルと「Conversational AI」「Enterprise Search」の機能を提供している。
ここでは具体的なユースケースを示した。自転車販売会社のWebサイトにAI Chatを組み込む事例では、Conversational AIがユーザーの要望に合わせて最適な自動車を提案する。ユーザーが所有している自転車の画像をもとに車種を特定し、購入提案をしている新たな自転車との比較を表示したり、会話の要約を表示したりするほか、購入が決まれば購入予約や受け渡し日程の調整もAIが行う。
Google Cloudの下田倫大氏は、「ルールに則った対応ではなく、状況に応じた臨機応変での対応が可能になるだけでなく、エンタープライズの要件にあわせた対応が可能になる。Google CloudのジェネレーティブAIによって、柔軟で、賢いチャットボットが利用できるようになる」と説明した。
この記事の編集者は以下の記事もオススメしています
-
AI
グーグル、大規模言語モデル「PaLM 2」モバイル端末で動作する軽量モデルなど計4サイズを発表 -
AI
グーグル「Bard」ついに日本公開 「ChatGPT」対抗のAIチャット -
トピックス
グーグル、大規模言語モデル「PaLM」のAPIを発表 -
デジタル
アクセンチュアとGoogle Cloud、パートナーシップを拡大。サイバーレジリエンス強化へ -
AI
グーグル、「Vertex AI」で「PaLM 2」が使える生成AIサポートを一般公開 -
AI
グーグル、翻訳したテキストと音声を同時に生成する大規模言語モデル「AudioPaLM」発表 -
AI
グーグル、AIモデル学習のため「ウェブ上の全情報を使う」米国版のポリシー変更 -
デジタル
CData、Google CloudのCloud SQLの認証を取得。AlloyDBとBigQueryは取得済み -
ビジネス・開発
GoogleのマルチモーダルなAIモデル「Gemini」、開発者・企業向けにプレビュー開始 -
AI
グーグル、LLMを活用したマルチモーダル動画生成モデル「VideoPoet」発表