このページの本文へ

実利用に焦点をあてて設計、日本語性能評価にも対応

RAGのベンチマークツール、Recursiveがオープンソースで公開

2024年08月07日 16時30分更新

文● ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 AIスタートアップのRecursiveは、2024年8月6日、RAGシステム向けのオープンソースのベンチマークツール群「Flow Benchmark Tools」を、GitHubにて公開した。

 Flow Benchmark Toolsは、セマンティック検索やクエリ生成、LLM(大規模言語モデル)に基づいた回答生成など、RAGシステムの実用的な性能に焦点をあてた評価ツール。英語だけではなく日本語性能も測定できる。

 Recursiveは、RAGシステムの評価における業界標準になることを目指し、実社会のシナリオを反映した評価と最適化が行えるようFlow Benchmark Toolsを開発したという。

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    デジタル

    「そんなことも知らんで、介護やってるんですか?」 救急隊員の一言からkintone×AIの組織変革が始まった

  2. 2位

    TECH

    Claude CodeのPlan modeをやめてみる ~grill-meスキルで一歩ずつ設計を固め、アプリを作る~

  3. 3位

    ネットワーク

    「手のひらネットワーク機器」第4弾が登場、テーマは“ShowNetを手のひらに”! こだわりの両面マウントや高密度ポートも 6月11日発売

  4. 4位

    TECH

    Obsidianで構築したエンジニアの「第二の脳」― 個人ナレッジベース構築のすべて

  5. 5位

    TECH

    出自で決まる「SASE」の最適解 主要外資ベンダー5社のコンセプトと強み

  6. 6位

    TECH

    FortiGateの圧倒的シェアをサプライチェーン防御に生かす フォーティネット 2026年度事業戦略

  7. 7位

    デジタル

    ブラックスケルトンモデルも登場!ヤマハ初のWi-Fi 7対応AP「WLX333」「WLX232」投入

  8. 8位

    ITトピック

    AIによるソフト開発加速の裏で「未テストの本番投入」も増加/「AIで日常生活が変わった」まだ45%/企業のコンサルへの不満、ほか

  9. 9位

    ビジネス・開発

    「デザインの仕事は半減するかもしれない」 MIXIデザイン本部が挑む「AIネイティブなものづくり」への転換

  10. 10位

    ビジネス・開発

    急増するトークン消費にマルチモデル化 AI活用は“見える化”してから広げる時代に

集計期間:
2026年06月02日~2026年06月08日
  • 角川アスキー総合研究所