OpenAIは3月23日(現地時間)、ChatGPTをサードパーティを含む外部に接続できるプラグインおよびその開発手段を公開した。当初は少数の開発者とChatGPT Plusユーザーを優先するが、順次公開範囲を広げる模様。ウェイティングリストも用意されている。
最新情報を取得してパワーアップ
多くの大規模言語モデル(LLM)は基本的に学習時のデータしか参照できないため、最新の情報に弱いという欠点があった。事実、ChatGPTもこれまで2021年9月頃までの情報に限定されていたが、今回発表された「検索プラグイン」を利用すると、インターネット上にある最新の情報を取得した回答が生成できるという。
また、プラグインによって会社のドキュメントや個人的なメモなどを使ってモデルを学習させることで、会社や個人の知識を持った独自のAIを開発することも可能になる。
さらに、プラグインでフライトの予約や食べ物の注文など、ユーザーに代わってアクションを実行することも可能だ。
とはいえ、プラグインが有害な、あるいは意図しない動作をすることで安全上の問題を引き起こすリスクもあるため、OpenAIは社内および外部の協力者とともにレッドチームを構成し、考えられる多くの問題シナリオを明らかにし安全対策を実施しているという。
ブラウジングプラグイン(アルファ版)
Browsingプラグインを使えば、ウェブから最新のコンテンツを取得して、それを元にChatGPTに回答させることができる。その際、引用元サイトも明示される。
プラグインは検索する際、マイクロソフトの「Bing検索API」を使用しているため、情報源の信頼性と真実性および問題のあるコンテンツの検索を防ぐための「セーフモード」はマイクロソフトの研究に基づいている。
プラグインは隔離されたサービス内で動作するため、ChatGPTのブラウジング活動は他のインフラから切り離されるという。
また、このプラグインはrobots.txtファイルに従うよう設計されているため、ChatGPTに情報をクロールされたくない場合はrobots.txtでユーザーエージェント「ChatGPT-User」を弾いておけばよい。
コードインタープリタープラグイン(アルファ版)
Code interpreterプラグインを使えば、チャット内でプログラム言語Pythonを使用してプログラムを実行できるほか、ディスクスペースも提供し、ファイルのアップロードやダウンロードもできる。
用途としては、定量・定性的な数学問題の解決、データ分析・可視化、ファイルの変換などが考えられる。
安全性への配慮から、AIが生成したコードはセキュリティで保護された環境内でしか実行されず、外部のインターネットアクセスは禁じられている。また、各セッションにはリソースの制限も設けられている。
検索(Retrieval)プラグイン
オープンソース化されたRetrievalプラグインを使用すれば、ChatGPTに自然言語で質問することで、個人または組織のファイル、メモ、電子メール、ドキュメントといったデータソースにもアクセスできるようになる。
サードパーティープラグイン
今回公開されるサードパーティープラグインは、Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram、Zapierの合計11種類。
サードパーティープラグインを使えば、たとえばExpediaプラグインでチケットを予約する、OpenTableプラグインでレストランの席を予約するといったことがチャット内で可能になる。
OpenAIは3月1日にChatGPTのAPIを公開したばかりだが、サードパーティー製のプラグインを許可することでChatGPT自体がプラットフォーム化したともとらえられる。OpenAIとマイクロソフトは爆発的なAIブームの「全部取り」を狙っているのだろうか。