ChatGPTの技術背景を学び、今後のビジネスの方向性を知る

2023年11月6日(米西海岸時間)、ChatGPTを提供するOpenAIは、同社初となる開発者向けカンファレンスを開催した。いくつかの大規模な拡張がなされた中で、目玉といえるのがChatGPTのカスタム化に関する部分だといえる。

カスタムなチャットシステムは、企業の問い合わせやサポート窓口の大幅な省略化や今後はセールスでも活用が拡大。また、スウェーデンやデンマーク、エストニアなどでは多くの公的機関がチャットBOTが活用されている。

一方、ChatGPTは、7月6日のデータ分析・コード実行、9月25日の音声・画像への対応、同27日のブラウジング対応、10月16日のDALL-E3(画像生成)と次々に機能追加がされた。もはや一般メディアに注目された夏までのChatGPTとは異なる意味を持つものとなっている。

そこで、現在のChatGPTの技術背景を学びながら今後のビジネスに役立てる方向性を知る講座「ChatGPTはどう変わろうとしているのか ――OpenAI DevDay に見る生成AIのマルチモーダル化とカスタム化への動向」を開催する。講師の丸山不二夫氏は、ChatGPTの根幹であるディープラーニング講座が5回の追加開催となるなど好評をいただいているものだ。

OpenAI DevDay に見る生成AIのマルチモーダル化とカスタム化への動向(文:丸山不二夫 氏)

ChatGPTの登場から、約一年が過ぎようとしています。その衝撃が冷めやらぬ今また、大きな変化が起きようとしています。11月6日に開催されたOpenAIの開発者向けのイベントOpenAI DevDayでのGPT-4 Turboの発表は、ChatGPTがどう変わろうとしているかを示すものになりました。

OpenAIはこう語ります。

"ChatGPT can now see hear and speak"

「ChatGPTは、いまや見ることも聞くことも話すこともできる」

ChatGPTへの音声インターフェースは、すでにOpenAIサードパーティ製品が数多く出ているのですが、OpenAI DevDayでの、音声を用いてのChatGPTの操作のデモは、未来のインターフェースを予感させるとても印象的なものでした。

また、今回のDevDayでOpenAIが、開発者がAgent(ロボット)-likeなAIアプリを開発することを助けるAssistant API を公開したことは未来のAIに向けての重要なステップだと思います。さらに、GPT4-fine-tuningへのアクセス提供にとどまらず、Custom Model をサポートするプログラムを公開したことは注目に値します。もちろん、このCustom Model サポートは、現在はまだごく一部の大企業向けの高価なプログラムなのですが。

今回のセミナーでは、生成AIのマルチモーダル化とカスタム化の動向にフォーカスして、それを可能とする技術とその背景を解説しようと思います。

受講者が、マルチモーダル化とカスタム化の最新の動向を知ることを通じて、「見ることも聞くことも話すこともできる」AI、かつ、「カスタマイズ可能」なAIが、どのような応用の可能性を開くかを実践的に考えるきっかけになればいいと考えています。

次のような構成を予定しています。

第一部 大規模言語モデルの成立とChatGPTの成功の背景

・AttentionメカニズムとGoogle機械翻訳

・TransformerとBERT

・ChatGPTとReinforcement Learning from Human Feedback



第二部 生成AIのマルチモーダル化の進行

・画像認識とAttention

・Google Vision Transformer

・OpenAI CLIP: Connecting text and images



第三部 OpenAI DevDayに見るマルチモーダル化とカスタム化の動向

・OpenAI DevDay -- コスト・パフォーマンスの向上

・More Modalities -- DALL-E 3, GPT4 Turbo with Vision , Whisper V3

・Assistants API

・GPT4-fine-tuning, Custom Model



第四部 マルチモーダルでカスタム可能なAIの課題と展望

・「眼を持ったGPT-4」にできること -- GPT-4V System Cardを読む

・「眼を持ったAI」の課題 -- GPT-4Vの技術的達成と限界

・マルチモーダルでカスタム可能なAIの登場の中でAIの未来を考える

講師からのメッセージとプロフィール

コロナのパンデミックが日本を襲った2020年の春、「一時避難」のつもりで田舎に帰ったのですが、東京に戻るタイミングが掴めず、それ以来、北海道の稚内に住んでいます。

ただ、東京にいた時、定期的に行なってきたセミナー開催の活動は、対面からオンラインに変わりましたが、ずっと継続しています。インターネットは、本当に素晴らしくありがたいと感じています。

現在は、次の二つのサイトを通じて、技術と科学のアーリーアダプターをターゲットに、「技術と科学の未来講座」をキー・コンセプトとして、ほぼ毎日ネットに情報を発信しています。

●マルレク+MaruLabo サイト:https://www.marulabo.net/

●YouTube チャンネル Maruyama Lectures:https://www.youtube.com/@MaruyamaLectures

丸山の現在の活動・関心については、この二つのサイトのトップページを見ていただけたらと思います。

東京での対面のセミナーは、コロナ以降今回が初めてで、3年7カ月ぶりです。みなさんとお会いできることを、楽しみにしています。

講師:丸山不二夫(まるやま・ふじお)

東京大学教育学部卒業。一橋大学大学院社会学研究科博士課程修了。数理哲学者で教育者。稚内北星学園大学学長、早稲田大学大学院情報生産システム研究科客員教授、はこだて未来大学システム情報科学部特任教授等を歴任。オープンソースのコミュニティ活動に積極的に参加。日本Javaユーザー会名誉会長。日本Androidの会名誉会長。クラウド研究会代表。近年では、日本のIT業界がグローバルな技術イノベーションの一翼を担うことを目標に、連続講演会「マルレク」を主宰し、人工知能や量子情報などについて講演を行っている。

開催概要 ChatGPTはどう変わろうとしているのか

――OpenAI DevDay に見る生成AIのマルチモーダル化とカスタム化への動向

■講師:丸山不二夫(連続講演会「マルレク」主宰)

■開催日時:2023年11月24日 (金) 18:00 - 21:00(17:30開場)

■会場:五番町グランドビル 7F 東京都千代田区五番町3−1

■定員:100名

■参加費:一般 3,000円、学割 1,500円(当日学生証を提示してください)

■主催:株式会社角川アスキー総合研究所

イベント開催時間、各プログラムの開始終了時間は状況により変更する場合があります。イベント当日に大きな問題が発生した場合には中断・終了する可能性があります。詳しくは、申し込みサイトをご覧ください。