このページの本文へ

金融・情報通信・製造・公共・流通において3つの軸でRAG性能を評価

RAGソリューションの日本語“性能表”、5業界対象にAllganizeが公開

2024年09月17日 14時00分更新

文● ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 Allganize Japanは、2024年9月13日、RAGソリューションの日本語性能を評価した「Allganize RAG Leaderboard」をHugging Faceにて公開した。

・Allganize RAG Leaderboard https://huggingface.co/datasets/allganize/RAG-Evaluation-Dataset-JA

 Allganize RAG Leaderboardは、RAGソリューションの構成要素である、文字・図・表などを抽出して読みやすいフォーマットに変更する「Parser」、独自データから回答となる情報を抽出する「Retriever」、抽出した情報と学習データから回答を生成する「Generation」の3つの能力を評価したもの。加えて、金融、情報通信、製造、公共、流通・小売の5つの業種のドキュメントに対してRAGの性能を測っている。また、客観的な評価になるよう、自動性能評価方法を採用して、4つの測定ツール(LLM Eval)を用いているという。

 評価対象のRAGソリューションは、Allganizeの提供する「Alli」、「LangChain」、「OpenAI Assistant」、「Cohere」であり、対象は今後も追加される予定。評価に利用したデータセットもHugging Faceに公開されている。

カテゴリートップへ

アクセスランキング

  1. 1位

    ITトピック

    定説をくつがえすNTTの研究 体が理想通りに動かないのは「筋活動のタイミング」が主因

  2. 2位

    sponsored

    AWS黎明期を駆け抜けた後藤和貴の卒業――東京リージョン開設前夜からAI時代へつなぐ、エンジニアの心得

  3. 3位

    ITトピック

    インフラ技術者の7割が“OS・基盤技術の理解不足”に直面/AIを育てる新職種「AIトレーナー」は儲かるか? ほか

  4. 4位

    デジタル

    「ツーピザルール」はもう古い? AI開発でチームは少人数のジェネラリスト集団に

  5. 5位

    データセンター

    再編続く大手SIer系データセンターの現在地 AIによる電力コスト高騰にどう応えるか

  6. 6位

    データセンター

    物理容量33%アップ! 4000心の多心光ファイバケーブルが登場 フジクラが国内データセンター向けに

  7. 7位

    Team Leaders

    実はできる! Power Automateでテーブル設定済みのExcelファイルを新規作成する方法

  8. 8位

    ビジネス・開発

    AI人格に“老い”や“葛藤”を宿す実装論 それっぽく話すチャットボットから脱却するために

  9. 9位

    ビジネス

    “キャリア人材=即戦力”は幻想 活躍の鍵は「1年以上の支援」と「正確な情報提示」

  10. 10位

    ビジネス・開発

    日本企業には「オープンウェイトなLLM」が必要 アリババクラウドが日本の体制強化へ

集計期間:
2026年03月12日~2026年03月18日
  • 角川アスキー総合研究所