このページの本文へ

AIの実力、どう測る? 時代遅れのベンチマーク、 信頼できる評価方法とは

2025年05月15日 06時59分更新

文● Russell Brandom

  • この記事をはてなブックマークに追加
  • 本文印刷

シリコンバレーのAI企業が熱狂するベンチマークテスト。だが、その評価方法には深刻な欠陥があることが明らかになってきた。高得点を競う企業は「テスト対策」に走り、本来測るべき能力が正確に評価されていない現状が「評価の危機」を引き起こしている。

カテゴリートップへ

  • 角川アスキー総合研究所

MSIが変える、未来のクリエイターを育てる教育環境

アスキー・ビジネスセレクション

ピックアップ