このページの本文へ

金融・情報通信・製造・公共・流通において3つの軸でRAG性能を評価

RAGソリューションの日本語“性能表”、5業界対象にAllganizeが公開

2024年09月17日 14時00分更新

文● ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 Allganize Japanは、2024年9月13日、RAGソリューションの日本語性能を評価した「Allganize RAG Leaderboard」をHugging Faceにて公開した。

・Allganize RAG Leaderboard https://huggingface.co/datasets/allganize/RAG-Evaluation-Dataset-JA

 Allganize RAG Leaderboardは、RAGソリューションの構成要素である、文字・図・表などを抽出して読みやすいフォーマットに変更する「Parser」、独自データから回答となる情報を抽出する「Retriever」、抽出した情報と学習データから回答を生成する「Generation」の3つの能力を評価したもの。加えて、金融、情報通信、製造、公共、流通・小売の5つの業種のドキュメントに対してRAGの性能を測っている。また、客観的な評価になるよう、自動性能評価方法を採用して、4つの測定ツール(LLM Eval)を用いているという。

 評価対象のRAGソリューションは、Allganizeの提供する「Alli」、「LangChain」、「OpenAI Assistant」、「Cohere」であり、対象は今後も追加される予定。評価に利用したデータセットもHugging Faceに公開されている。

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    ビジネス・開発

    いますぐ捨てたいITサービスは? AI推しにそろそろ飽きてません? 情シスさんのホンネを「ゆるっとナイト」で聞いた

  2. 2位

    ITトピック

    「AI導入で人員を減らしても収益は増えない」その理由/「専任情シス不在」中小企業の3社に2社/ユーザーアカウント流出が加速、ほか

  3. 3位

    エンタープライズ

    基盤も古いし、コードも酷い! そんなクエストにGitHub Copilotで試行錯誤しまくった「みんな」こそ最高

  4. 4位

    Team Leaders

    Power AutomateでSharePoint APIを使う ― SPOリストを自動作成するフローを作ろう

  5. 5位

    sponsored

    完全自動運転の実現へ、チューリングが開発基盤にGMO GPUクラウドを選んだ理由

  6. 6位

    ソフトウェア・仮想化

    日本の自治体がみんな使っている「ManageEngine」 IT運用のすべての課題解決を目指す

  7. 7位

    クラウド

    「すでに開発コードの4分の3はAI生成」 Google Cloud CEO、エージェント時代の戦略を語る

  8. 8位

    ソフトウェア・仮想化

    AIエージェントを野放しにしない ― ServiceNowは“AI司令塔”で自律とガバナンスを両立

  9. 9位

    ビジネス・開発

    「粗悪記事」「ゼロクリック」「搾取」からクリエイターをどう守るか? AIに強いnoteが挑む創作エコシステム

  10. 10位

    TECH

    「蟻の一穴」となるリモートアクセスVPNの脆弱性 ZTNA/SASEはなぜ必要か?

集計期間:
2026年05月12日~2026年05月18日
  • 角川アスキー総合研究所