このページの本文へ

前へ 1 2 3 4 5 6 7 次へ

エンジニア魂が燃えたぎる!生成AI開発イベント「AI Challenge Day」 第3回

RAGとマルチモーダルにチャレンジするエンジニアの祭典が戻ってきた

生成AIの熱き戦いが品川でも! GPT-4oもフル活用されたAI Challenge Day 2nd

2024年07月19日 09時00分更新

文● 大谷イビサ 編集●ASCII

提供: 日本マイクロソフト

  • この記事をはてなブックマークに追加
  • 本文印刷

 2024年6月11・12日、角川アスキー総合研究所(以下、ASCII)と日本マイクロソフトは、「AI Challenge Day 2024 2nd」を品川の日本マイクロソフトオフィスで開催した。神戸での開催に引き続いて第2回目となる同イベントには今回も生成AIのビジネス化を目論むパートナー10社が参加。リリースされたばかりのOpenAIのGPT-4oもフル活用され、最新の生成AIの可能性をいち早く感じられるイベントとなった。

RAG構築で観光アシスタントを作れ! あれ? 前回とテーマは同じ?

 生成AIの活用コンテスト「AI Challenge Day 2024」が品川に帰ってきた! 4月の第1回目では、日本マイクロソフトのパートナー10社が神戸にある「Microsoft AI Co-Innovation Lab 神戸」に乗り込み、2日間に渡って生成AIを活用したサービス開発にチャレンジした(関連記事:日本マイクロソフトのAIパートナー10社が神戸に集合 RAGとマルチモーダルに挑む)。2回目は品川の日本マイクロソフトオフィスに10社が集結し、2日間のスケジュールでサービス開発と発表を行なった。

 初日となる6月11日の朝。パートナー10社のメンバーが三々五々、日本マイクロソフトのオフィスに集合。「2nd」ということで、参加するのはすべて新しいパートナーだ。各チームは会議室を割り当てられ、Teamsを用いたオンラインでお題発表を受ける。

AI Challenge Day 2024 2ndがいよいよスタート!

 実は今回のテーマも1回目とほぼ同じ日本の世界遺産を紹介する世界遺産トラベルアシスタントの開発だ。事前に与えられた世界遺産についての質問に対して、正解にどれだけ近づけられるかを競う質問応答FAQアシスタント、世界遺産の写真データから問題の質問に答えるマルチモーダルアシスタントの2つをスクリプトで評価するという内容となっている。

お題は1回目と基本的に同じ

 開発に必要な技術も基本的には1回目と同じで、日本の世界遺産についての質問を正確に回答するためのRAG(検索拡張生成)が必要となる。おさらいしておくと、RAGはRetrieval Augmented Generationの略で、AIオーケストレーターがアプリからの質問に対する検索結果(Retrieve)に基づいて、LLM(大規模言語モデル)に対するプロンプトを生成し(Augmented)、回答を生成する(Generation)というアーキテクチャで構成される。

 採点方法も1回目と同じで、基本は回答と正解の類似性を図るChatGPTのプロンプトを使う。このスクリプトによる採点に、審査員による独自評価を追加。算出された総合点で、全部で5つの賞を争うことになる。

2ヶ月前の課題がすでに陳腐化? AIの技術革新についていけるか?

 1回目と同じお題ということで、「すでにネタバレされているのでは?」と疑問を持つ読者もいるかもしれない。確かに前回はプレゼンの模様がYouTubeでリアルタイム配信されており、各チームからのブログも数多く出ている。今回参加したチームもこれらを読み込んで来ているため、基本的には1回目のやり方を踏襲すれば勝てるはずだ。しかも、この2ヶ月の間に、GPT-4oという伝家の宝刀とも言える最新サービスが発表されているため、前回のお題であれば余裕で回答できてしまう可能性すらある。

 しかし、出題者である日本マイクロソフトの花ヶ崎伸祐氏も、当然そこは織り込み済み。提供されるデータセットが以前にも増して凶悪、もといチャレンジのしがいのある内容となっているのだ。そのため、スクリプトで算出された点数も1回目とは別物で、2回目独自のものとなる。「まさか、同じテーマだと思わなかったですよ」というちょっと安心したような参加者のコメントも聞かれたが、素材をダウンロードしたら、同じコメントが言えるだろうか。なにも知らないチームはいったん対面で集合し、アナログなあみだくじでプレゼンの順番を決定。さっそく2日間のチャレンジがスタートする。

今回はアナログなあみだくじでプレゼンの順番を決定!

 さて、各チームとも翌日まではひたすら開発。しかも、外から部屋の様子がのぞけないため、Teamsでメッセージが来ないと様子もうかがえない。順調なのか、詰まっているのかわからず、かえって心配。そこで神戸のときと同じく、日本マイクロソフトのメンバーと定期的に進捗状況を聞きに行くことにした。

若手の多いFIXERチームの作業風景

ホワイトボードの書き込みが試行錯誤をうかがわせるリコージャパンのお部屋

 夕方時点で聞いたところでは、初日のタスクとして周知していた「とりあえずスクリプトを回してみる」を実現していたチームは、実は半分にも満たなかった。それなりの点数を出しているチームはほとんどない。とはいえ、神戸のように時間を延長したいというリクエストもなく、定時である18時に各チームはオフィスを去って行く。果たして明日はどうなるのか? 若干の不安を感じつつ、イベントの初日は静かに始まり、静かに終わった。

前へ 1 2 3 4 5 6 7 次へ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

アクセスランキング

  1. 1位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  2. 2位

    ITトピック

    若手が言わない“本音の退職理由”上位は/「データ停止は景気後退よりも企業の脅威」6割/クライアントに告げずAI活用するフリーランス、ほか

  3. 3位

    ビジネス・開発

    最悪のシナリオは「フィジカルAI」による基幹産業の衰退 日本の勝ち筋は、“同期技術”と“ドメイン知識”

  4. 4位

    Team Leaders

    ファイル名が命名規則に合っているかの自動チェック、Power Automateのフローで実現しよう

  5. 5位

    TECH

    “GPUなし”ノートPCで動くLLMで、ローカルAIエージェントを自作する

  6. 6位

    TECH

    糖尿病超早期を採血なしで検出、予防へ! 代謝や臓器のつながりに着目した予防法開発

  7. 7位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

  8. 8位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  9. 9位

    TECH

    業界横断で“サイバー攻撃から供給網を死守” NTT・アサヒ・トライアルらが「流通ISAC」始動

  10. 10位

    Team Leaders

    バックオフィス業務もAIに“丸投げ” マネーフォワードが「Cowork」機能を2026年7月に投入へ

集計期間:
2026年04月08日~2026年04月14日
  • 角川アスキー総合研究所