このページの本文へ

「ご都合主義」蔓延るAIベンチマーク、問われる評価基準の信頼性

2024年11月29日 07時00分更新

文● Scott J Mulligan

  • この記事をはてなブックマークに追加
  • 本文印刷

AIモデルに対して実施するベンチマークテストは、企業が自社のモデルの性能をアピールするためにしばしば利用される。だが、新たな研究によると、こうしたベンチマークテストは、設計が不十分であることが多いという。

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ