このページの本文へ

中国製AIはハルシネーションレートですでに世界一

2024年09月14日 18時00分更新

文● 大谷イビサ　編集●ASCII

2024年9月13日付けのHallucination Leaderboard

　AIがあたかも本当のように事実と異なることを言ってしまうハルシネーション（幻覚）。どのくらい幻覚を見るかを示すハルシネーションレートは、各社がしのぎを削る大規模言語モデル（LLM）の精度の高さを証明する1つの指標となっている。

　さて、各LLMのハルシネーションレートを比較すべくAI企業Vectaraが開発したGitHub上のHallucination Leaderboardを見ると、現在（2024年9月13日付け）は中国版ChatGPTとも言われる「智譜AI（Zhipu AI）」のGLM-4-9B-Chatが1.3％でもっともハルシネーションレートが低い。出たばかりのOpenAI o1 miniの1.4％、GPT-4oの1.5％を抑えての1位は正直すごい（冒頭のグラフ参照のこと）。

　そういえば先日、コープさっぽろCIOの長谷川秀樹氏が「ハルシネーションがある限り、企業では生成AIは使えないというCIOが多くて驚いた」とOpenAIイベントでの感想をSNSでコメント。確かに、この先も日本企業はハルシネーションレート0％まで求め続けるのだろうか？　長谷川氏も同じ投稿で「人間オペレーションの方が、ハルシネーション多くね?www」とコメントしていたけど、まさにそうだなと。明らかにハルシネーションみたいな発言をする人ってどこにでもいますよね。

文：大谷イビサ

ASCII.jpのクラウド・IT担当で、TECH.ASCII.jpの編集長。「インターネットASCII」や「アスキーNT」「NETWORK magazine」などの編集を担当し、2011年から現職。「ITだってエンタテインメント」をキーワードに、楽しく、ユーザー目線に立った情報発信を心がけている。2017年からは「ASCII TeamLeaders」を立ち上げ、SaaSの活用と働き方の理想像を追い続けている。

ツイートする

カテゴリートップへ

AIオススメ記事

ピックアップ

sponsored
基調講演には総務省 CISOの山内智生氏が登壇、サイバー空間をめぐる脅威動向や政策を紹介

ランサム感染の実体験からMDR導入事例までが語られた「Canon Security Days 2024」
sponsored
「LEVEL-15FXA61-R7-RM4X」を試す、重さは2.26kg、144Hzにも対応

実家・ホテル・コタツでゲームしたいなら、Ryzen 7とRTX 4060のLEVEL∞15.6型ノートPC
sponsored
「M75 WIRELESS」「K70 PRO TKL」「VIRTUOSO MAX」を試す

いずちののさんにCORSAIRの白いゲーミングデバイスを試してもらった、淡い光り方に「カワイイ」と太鼓判
sponsored
180Hz駆動でGTG0.5msのRAPID VAパネルを搭載、MSI「MAG 325CQRF QD E2」

ゲームの世界にいるみたい！没入プレイしたいなら大画面の湾曲ゲーミングディスプレーがおすすめ
sponsored
“ツールを入れただけ”じゃ、プロジェクト・タスク管理は回らない！

Backlogの利用をチーム内で定着させたい？初歩のノウハウをまとめます
sponsored
セキュリティログの分析／可視化「FortiAnalyzer」と、高度なAIアシスタント「FortiAI」

“アラート疲れ”で担当者がサイバー攻撃を見落とす！どうやったら防げた？
sponsored

狭い机でも縦置き／横置きどちらもOK！高性能な小型デスクトップパソコンでノートPC以上の作業効率アップを狙う
sponsored
ファーウェイ製スマートウォッチは、家族や知人、自分（!?）へのプレゼントにもピッタリ！

バッテリー長持ちのスマートウォッチで2025年こそ健康的な生活！クリスマスプレゼントに合う製品を紹介！
sponsored
JAPANNEXTの「JN-IB375C144UQR-H」をレビュー

144Hzで21：9の3840×1600ドット37.5型ウルトラワイドディスプレー、ゲームの没入感や仕事の効率アップがスゴイ
sponsored
ポータブルゲーミングスピーカー「TQ-PG300」

パイオニアの小型ゲーミングスピーカー、想像を超える没入感でめちゃくちゃ驚きなんですけど！
sponsored
今回も医療機器認証取得で、かつ前モデルよりも薄く軽いサイズを実現！

スマートウォッチのようでこれは血圧計でもある!? 「HUAWEI WATCH D2 ウェアラブル血圧計」レビュー
sponsored
1本のサウンドバーで360立体音響が実現！

自宅で映画を見るならソニー「HT-A9000」が最高の選択だ
sponsored
「QuTS hero」はランサムウェア対策、安価なSSD／大容量HDDの導入など、中小企業オフィスでも役立つ

NASのデータ保護強化におすすめ！ QNAPのハイエンドOSが中小企業向けモデルにも対応
sponsored

狭い机という課題は「二刀流」で解決、いまあえて選ぶべき一体型パソコンが「IdeaCentre AIO 27IRH9」
sponsored
ゲーマーからクリエイター向けまで、オススメマザーを紹介！

Core Ultra 200Sで自作するならコレ！ASUSのクラス別Z890マザーボード5選
sponsored
自作の煩雑さやトラブルシューティングの手法は軽減！MSI「MAG Z890 TOMAHAWK WIFI」

光らない！ドラゴンなし！ Core Ultra 200S世代の硬派なゲーミングPC向けZ890マザーボードは、自作PC初心者にも簡単で分かりやすくておすすめ
sponsored
Backlogに招待するだけでは「使ってくれない」、ではどうする？

うまくいく！複数人チームでのプロジェクト・タスク管理立ち上げの方法
sponsored

手軽に“壁100インチ”の大画面を楽しもう！自宅が映画館になる「JMGO N1S Ultra 4K」を推す理由
sponsored
JN-38i160U-H-C9をレビュー

PS5 Proの4K/120fpsプレイを大迫力で！38型でKVM機能付きのゲーミング液晶がかなりイイ
sponsored
CyborgやThin、Clawなどが最大25%オフ！

AmazonブラックフライデーでMSIのゲーミングPCが即ポチレベルの格安価格で買えるぞ！
sponsored
リモートワーク環境はまだまだセキュリティ対策が不十分

ハイブリッドワーク中の社員PCがフィッシング詐欺被害！どうやったら防げた？
sponsored
高価格にも納得できるサウンド

7万円の高額ワイヤレスイヤホン「B&W Pi8」の音が、泣けるほど良かった
sponsored
JN-IPS27WQHDR-C65W-FLD-Tをレビュー

27型WQHDディスプレー最強格現る、昇降式・USB給電・KVM・タッチの超多機能で4万円台
sponsored
180Hzで0.5ms（GTG）のRAPID VAバネルを採用した「MAG 275CQRF QD E2」

5万円弱も納得の高速進化したゲーミングディスプレー。27インチならWQHDがおすすめなのにはワケがある
sponsored
UPS搭載で自作派・ゲーマーにも便利、防災の備えこそ、日常的に使いたい

防災用に「ポタ電」を買いたいなら、まずこの１台！　緊急時も日常でもちょうどいい「Jackery ポータブル電源 1000 New」
sponsored
インテル Core Ultra プロセッサー（シリーズ 2）を搭載した最新モデル登場

今後のPCはAI対応が当たり前になる、それならエイサーのCopilot+ PCがいいーー「Swift 14 AI」で生産性アップ
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！