画像クレジット:Stephanie Arnett/MITTR | Envato
グーグルは3月21日、チャットGPTやビング・チャットに対抗する「バード(Bard)」を米国と英国でローンチした。ユーザーのフィードバックを得て、検索体験に不可欠な存在に育てたい考えだ。
検索最大手のグーグルは、オープンAIのチャットGPT(ChatGPT)とマイクロソフトのビング・チャット(Bing Chat)への対抗策として、バード(Bard)をローンチした。ビング・チャットと異なり、バードは検索結果を参照するものではない。バードが返すのは、すべてモデル自身が生成した情報である。だが、ユーザーのブレイン・ストーミングを支援し、質問に回答することを目的として設計されている点は同じだ。グーグルは、バードを同社の検索体験に不可欠な存在に育てたい考えだ。
記者は3月20日、グーグルのロンドン・オフィスでデモを見せてもらった。バードは、ウサギをテーマにした子どもの誕生日パーティのアイデアをいくつも出し、観葉植物の手入れのコツをたくさん教えてくれた。「バードはクリエイティブなコラボレーターだと考えています」。グーグルのジャック・クラウチク上級製品部長は こう説明する。
グーグルはまた、今回のローンチに大きな期待を寄せている。マイクロソフトはオープンAIと提携し、検索機能におけるグーグルのトップの座を狙って積極的な動きを見せている。他方のグーグルは出だしから大失態を演じた。同社が2月に公開したバードのティーザー映像で、チャットボットが事実ではない回答を提示したのだ。グーグルの企業価値は一晩で1000億ドルも吹き飛んだ。
グーグルはバードの仕組みについて、詳細の多くを開示しないつもりだ。チャットボットのブームを支えるテクノロジーである大規模言語モデル(LLM)は、貴重な知財になっているからだ。ただ、グーグルの主力の大規模言語モデルであるLaMDA(ラムダ)の新バージョンをベースに構築されている。グーグルは、基盤となる技術の向上に伴ってバードをアップデートしていくという。チャットGPTやGPT-4と同様に、バードは、人間のフィードバックによる強化学習を用いて微調整(ファイン・チューニング)されている。これは大規模言語モデルを訓練して、より有用で害の少ない応答を返すようにする手法だ。
グーグルは過去数カ月間にわたってバードのプロジェクトを非公開で進めてきたが、まだ「実験」段階だという。ローンチ時点では米国と英国の待機リスト登録者に対して、無料で提供する(地域は順次拡大予定)。この早期ユーザーたちは、バードのテクノロジーのテストと改善に貢献することになる。グーグルの研究担当副社長であるズビン・ガラマニは、「ユーザーからフィードバックを得て、そのフィードバックに基づいて時間をかけて強化していきます」と話す。「私たちは、大規模言語モデルで起こり得るあらゆる問題に注意を払っています」。
だが、元グーグルのAI倫理チーム共同リーダーであり、現在はAIスタートアップ企業ハギング・フェイスで最高倫理科学者を務めるマーガレット・ミッチェルは、その構想に懐疑的な見方をしている。グーグルは何年も前からLaMDAの開発に取り組んでおり、「バードを『実験』として市場に出すのは、大企業が何百万人もの顧客を狙って使うPR手法であるのと同時に、問題が起きたときに責任を問われないようにするためです」と言う。
グーグルは、バードをグーグル検索に代わるものではなく、相棒として考えてもらいたいという。バードのチャット・ウィジェットの下にあるボタンには「Google it(ググる)」と書かれている。バードの回答を確認したり、さらに詳しく調べたりしたいときに、ユーザーをグーグル検索に誘導するのが目的だ。「テクノロジーの限界を補うための1つの方法なのです」とクラウチク部長は言う。
ガラマニ副社長は、「グーグルは、実際にいろいろな場所を探したり、分からないことがあれば確認したりすることを勧めたいのです」と説明した。
このような欠点に対する認識が、バードの設計には他にも反映されている。ユーザーがバードとやり取りできる時間には、セッションごとの制限がある。大規模言語モデルは、1回の会話にかかわる時間が長くなるほど暴走していく傾向があるからだ。たとえば、ビング・チャットのユーザーがおかしな応答をネットで共有しているが、その多くは対話を長々と続けた結果として出てきたものだ。
グーグルは、ローンチ時に会話にどのような制限を加えるかを明確にしていないが、最初のリリースではかなり低く設定し、ユーザーのフィードバックによって調整していく。
グーグルはコンテンツ面でも保守的な策をとっている。ユーザーは、(グーグルが判断する)わいせつ、違法、有害な資料または個人情報を要求することはできない。私が見たデモでは、バードは火炎瓶の作り方を教えてくれなかった。この世代のチャットボットの標準的な反応だ。だが、がんの初期症状の判断方法といった医療に関する情報も一切提示されなかった。「バードは医師ではないので、医学的な助言はしません」とクラウチクは言う。
チャットGPTとの最大の違いは、応答ごとに3つのバージョンを生成することだろう。これをグーグルは「ドラフト」と呼んでいる。ユーザーはいずれかをクリックして良いと思う応答を選択するか、いくつかを混ぜて組み合わせることができる。その意図は、バードは完璧な答えを生成できないという事実をユーザーに思い出させることだ。「1つの例だけを見せられると、それが絶対だという印象を受けてしまいます」とクラウチク部長は説明した。「それにグーグルは、事実性には限界があることを知っています」。
デモの中で、クラウチク部長は、バードに子どもの誕生日パーティーの招待状を書いてほしいと依頼した。バードは、カリフォルニア州サンラファエルのジムワールドの番地を入れた招待状を出してきた。「車でよく通る場所ですが、正直、通りの名前に自信がありません。そこでグーグル検索の出番です」。クラウチク部長は「ググる」をクリックし、番地が正しいことを確認した(実際に正しかった)。
クラウチク部長は、今のところグーグルは検索を置き換えることは考えていないと言う。「グーグルは20年以上かけて検索エンジンを完成させてきました」。だが、この指針は長期的な戦略というより、バードの現在の限界を示しているのかもしれない。発表の中でグーグルはこう述べている。「また、LLMをより深い形で検索に統合することも考えています。これからです」。
グーグルがオープンAI、マイクロソフトといった競合他社との開発競争の真っ只中にあることを考えると、それは遅かれ早かれ実現するかもしれない。「技術的に整っているかどうかは関係なく、企業はこの分野に突入し続けるでしょう」。ワシントン大学で検索技術を研究するチラグ・シャー教授はこう話す。「チャットGPTがビングなどのマイクロソフト製品に統合されている状況では、グーグルも当然同じことをせざるを得なくなります」。
シャー教授は1年前、同じくワシントン大学で大規模言語モデルを研究する言語学者のエミリー・ベンダー教授と共同で論文を執筆し、大規模言語モデルを検索エンジンとして使用する際の問題点を指摘した。当時はまだ、この論考は仮説の域を出ておらず、シャー教授は先走りすぎたかもしれないと心配していたという。
だが、この実験的なテクノロジーは異例のスピードで消費者向け製品に組み込まれた。「これほど早く今の状況になるとは思ってもみませんでした」とシャー教授は言う。「ただ、彼らに選択の余地はありません。自社のテリトリーを守らなければならないのですから」。