このページの本文へ

エンジニア魂が燃えたぎる!生成AI開発イベント「AI Challenge Day」 第1回

ASCII&マイクロソフトの「AI Challenge Day 2024 in Kobe」レポート

日本マイクロソフトのAIパートナー10社が神戸に集合 RAGとマルチモーダルに挑む

2024年05月21日 09時00分更新

文● 大谷イビサ 編集●ASCII

提供: 日本マイクロソフト

  • この記事をはてなブックマークに追加
  • 本文印刷

・選択肢が見えてしまい時間配分に迷いが出てしまったソフトバンク

 7番手はソフトバンクで、発表は向山氏。ケータイのイメージの強いソフトバンクだが、今回チームを組んだ5人はMSPサービスや生成AIエージェントを開発している法人向けサービスのメンバー。Azure OpenAI ServiceのチャットシステムやSemantic Kernelなどマイクロソフト製品を用いた開発実績もあるが、Azure AI Studioが今回初挑戦になるという。

画像データ処理で苦労したというソフトバンクの向山裕一朗氏

 評価スクリプトの結果は18.050点。アーキテクチャとしてはB2Cを前提としたパブリックアクセスを想定し、レート管理を介在させつつ、App ServiceからAzure AI Studioに流すという構成をとる。RAGの構築においては、PDFファイルをOSSでマークダウンに変換しつつ、ヘッダごとに分割ファイルを作成。AI Searchにインデックスを作成に関しては、「AI Studioを使えばボタンポチで実現できてとても楽だった」(向山氏)とのこと。

 成果としては、UIの開発やQ&A用のバックエンド開発のほか、semantic kernelを用いたハルシネーション箇所を排除するロジックの実装、PDFを含む各種ファイルのテキスト化、マークダウンファイルへの変換、チャンク化、画像ファイルなど一連の前処理までが時間内に終わったという。

 一方、Azure AI Searchへの画像データの処理は時間内に終わらず、「まだ部屋で実行中(笑)」(向山氏)とのこと。画像データをGPT-4 with Visionでメタデータ、Azure AI Visionでベクトルデータに変換し、AI Searchのインデックスに登録したのだが、メタデータの抽出に時間がかかり、実装まで進まなかった。初挑戦だった画像データの処理、前処理の検討に時間をかけてしまったのが苦戦ポイント。また、Azure AI Searchに投入するためのクエリもGPT-4で最適化したが、改善の余地がまだあったと振り返った。

 App Serviceへのデプロイは間に合わなかったが、既存の旅行予約サイトにチャットUIとして追加するのを前提としているという。審査員の吉田氏は、「普段、案件をゴリゴリやっているからこそ、選択肢が見えてしまうので、時間とのせめぎ合いはチーム内で難しかったと思う。くやしさが垣間見えつつ、帰ってからもいろいろやってくれそう。お土産の多いチームだと思う」とコメントした。
 

・B2CとB2Bの用途を連携させたJBSとネクストスケープ

 8番手は日本ビジネスシステムズ(JBS)とネクストスケープの合同チームで、発表はJBSの近藤亮太氏が担当した。グループ会社同士だが、昨日初顔合わせというメンバーでチームを構成。とはいえ、RAGやアプリケーション開発を担当しており、社内文書を検索するアイプリシティと呼ばれるシステム開発などで実績があるという。

ユーザーストーリーをしっかり仕上げてきたJBSの近藤亮太氏

 評価スクリプトは16.777点と、やや残念な結果。生成できなかった問題と画像3問を抜いた値で、「精度を改善する時間がなかったため、ぶっつけ本番だった」と近藤氏も振り返る。アーキテクチャとしては、ユーザーからの質問を受けたApp ServiceのアプリからAI Searchに検索をかけ、結果からクエリを生成。Azure OpenAI Serviceにプロンプトとして投げて回答を得るというオーソドックスな構成となっている。

 今回はドキュメントの種類が多種多様だったため、データの種類に応じたインデックスを作成した。セマンティック検索用の全文検索インデックスや画像からGPT-4で説明文を作成した場合のインデックスのほか、商品のCSVファイルは、ファイル名をインデックスに含めたり、Document IntelligenceでOCRをかけたりしたが、画像の検索は苦戦したという。

 また、回答生成に関しては、Chainlitを用いて、少ない工数でUIを実装。よい結果を引き出すためのプロンプトエンジニアリングを実施したり、ファイルの種類に応じたインデックスやセマンティック検索などの結果を用いた回答生成にもチャレンジした。Copilot Studioでのチャットボット生成も実装したが、UIの作成が自動化されるため、かなり便利だったと感想を述べた。

 ユーザーストーリーは、旅行好きのアプリユーザーを対象としたB2Cと、ユーザーの質問からペルソナを判定してプランを提案するB2Bの2つのトラベルサジェストを描いた。両者が連携しているため、「過去の質問履歴からペルソナを特定し、旅行プランを策定できるのではないか」(近藤氏)と提案。また、VNETを用いた通信の保護、セキュアな通信経路を用いたAzure OpenAI Serviceの利用、Blobのファイアウォール採用でのプライベートIPアドレスの遮断など、セキュリティにも配慮されている。

 審査員の花ヶ崎氏は、「(私も)データの多様性を重んじるがあまり、質問や回答の対象者を誰にするのか忘れていた。それを参加者の方々が整理してくれ、むしろありがとうございました。初挑戦でCopilot Studioまでチャレンジしてもらい、感謝しかありません!」と感謝のコメントを送った。

カテゴリートップへ

この連載の記事
  • 角川アスキー総合研究所