このページの本文へ

AIは人間に忠実か、ずる賢いか　OpenAIとAnthropicが合同チェック

2025年08月29日 10時15分更新

文● G. Raymond　編集●ASCII

　OpenAIは8月27日、Anthropicとの共同研究の成果を発表した。AIの安全性と、人間の意図に沿った行動を守れるか（アライメント）をお互いのモデルでテストする初の試み。

　2社は自らの内部評価手法を交換し、Anthropicは「Claude Opus 4」や「Claude Sonnet 4」を、OpenAIは「GPT-4o」や「GPT-4.1」、そして推論重視の「o3」や「o4-mini」といったモデルを対象にテストした。実験では通常のガードレールを一部解除し、わざと危険な場面や騙しのプロンプトを設定して反応を調べた。

　テストの結果、Claudeは「システム指示とユーザー要求が矛盾した場合」には非常に強く、OpenAIモデルを上回る場面もあった。一方で、「ジェイルブレイクアタック（禁止内容を引き出そうとする試み）」には、OpenAIのo3系がやや強い傾向を見せた。

　ハルシネーション（誤情報）の面ではClaudeは誤答を避けるため拒否率が高く、答えれば正確だが、実用性が下がるという課題が浮かび上がった。逆に、OpenAIモデルは答えやすいぶん、誤情報を混ぜやすい。欺瞞や「スキーミング」（意図的な手抜きや嘘）に関しては両社のモデルに強弱の差があり、推論能力の高さが必ずしも安全性に直結しないことも確認された。

　OpenAIはこの結果を「研究の優先分野が外部からも確認できた」とした上、ハルシネーションの削減や、ユーザーに媚びた応答の抑制に重点を置いた最新モデル「GPT-5」を投入したと主張している。Anthropicもまた、自社のモデルが未知のシナリオに強い点をアピールしつつ、改善の余地を認めている。両社は今後もこうした相互評価を続け、テスト手法の標準化を進める方針だ。

■関連サイト

ニュースリリース

ツイートする

カテゴリートップへ

AIオススメ記事

2026年02月16日

AI

わずか4秒の音声からクローン完成　音声生成AIの実力が想像以上だった
2026年02月23日

AI

ComfyUI、画像生成AI「Anima」共同開発　アニメ系モデルで“SDXL超え”狙う
2026年03月06日

AI

グーグル画像生成AI「Nano Banana 2」が変えた3つのポイント
2026年02月26日

Team Leaders

プロンプトのコピペはもう古い。自分専用AI「Gem」でチームの生産性を爆上げせよ
2026年02月20日

AI

Suno級がローカルで？音楽生成AI「ACE-Step 1.5」を本気で検証
2026年02月02日

AI

面白すぎて危険すぎ！ PCを“勝手に動かす”AI、OpenClaw（旧Moltbot／Clawdbot）とは
2026年03月02日

AI

ChatGPT→Claudeの“乗り換え”簡単に　Anthropicがメモリ取り込み方法を案内
2026年03月05日

AI

ChatGPTで障害発生
2026年03月06日

AI

OpenAI「GPT-5.4」発表　PC操作で“人間超え”、プロ業務でも83%の精度
2026年03月06日

AI

デジタル庁、国産LLM7件を選定　政府AIで8月から試用へ

ピックアップ

sponsored
“ゆるいチーム”ではない「心理的安全性の高いチーム」づくりのポイント

若手も控えめなメンバーも積極的に発言、そんな“風通しの良いチーム”を作るには？
sponsored
ヤマハが30年間貫く「絶対にユーザーを見捨てない」サポート体制

導入前の相談からトラブル解決まで完全伴走！情シスがヤマハ機器を「安心して買える」理由
sponsored
「TOKYO Gaming-PC STREET 7」よりbe quiet!の展示をレポート！

あまりにも“静かすぎるから”目立つ。be quiet!製PCパーツの魅力を再確認しました
sponsored
「TOKYO Gaming-PC STREET 7」よりパソコンショップSEVENの展示／ステージをレポート！

パソコンショップSEVENが語るBTO PCの本質。「ラーメンの注文やスーツのオーダーと同じこと」
sponsored
関西のネットワークの心臓部「堂島」直結　相互接続性と手厚いサポートで選ぶなら選択肢は1つ

大阪のDCといえばスマコネ！今選ばれるネットワークデータセンターとは？
sponsored
「Satechi OntheGo 7 in 1 マルチポートアダプター」レビュー

業務必須の7ポートをギュッとまとめたUSB Type-Cモバイルハブ「OntheGo」が買いだ！
sponsored
「TOKYO Gaming-PC STREET 7」よりサイコムの展示／ステージをレポート！

週末、秋葉原でサイコムのゲーミングPCを買うとめちゃくちゃお得だったんですよ。その理由とは……
sponsored
プリンストン「Barocco Mistel AIRONE PRO（日本語配列）」

極薄・軽量で極上の打鍵感！入力効率を劇的に向上させる65％メカニカルキーボード
sponsored

AMDのゲームテクノロジーセット「FSR “Redstone”」解説。新GPUが出なくてもソフトは劇的に進化する
sponsored

大きさ1.5倍はそのまま、食べて「おっ！」ファミマの「大きなおむすび」に意外な変化
sponsored
斬新ながらインテリアに溶け込むデザイン　最新のWi-Fi 7対応で性能も十分！

こんな“魅せまくる”Wi-Fiルーターってあった？ファーウェイの「HUAWEI WiFi Mesh X3 Pro」が美しすぎる
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

be quiet!の静音設計パーツを使いまくったら、ものすご〜く静かなゲーミングPCが完成するのでは？
sponsored
「デジタル資産×現場データ」の勝利の方程式とは？

フィジカルとAIをつなぐOODAループはもう実装可能　ソラコムとセンシンロボティクスが語る「リアルワールドAIプラットフォーム」
sponsored
マウスコンピューター「mouse K7-I7G50BK-A」

年度末のこの時期はPC買うべし！場所を取らずに大画面、32GBメモリー搭載の17.3型ノートがオトクなセール中
sponsored
マウスコンピューターのゲーミングPC「G TUNE FZ-I7G80」がセール中

【ゲーミングPCが7万円オフ】憧れのスペック（Core Ultra 7＋GeForce RTX 5080）の1台が今ならオトク！
sponsored

1リットルの衝撃、手のひらサイズに凝縮されたNVIDIA RTXのパワー！　プロが託す信頼の「ThinkStation P3 Tiny Gen 2」
sponsored
じゃんけん大会は400人参加!!

東北初出店のアプライド仙台店スゴすぎ！初日で約3000人来店したオープンイベントで1日店員してきた話
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

パソコンショップSEVENの強化ガラス製ピラーレスの白いゲーミングPCがかっこいい。触りにきませんか？
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

サイコムさんが、とあるイベント来場で1TB SSDを2TBに無償でアップグレードしてくれるらしいんですけど……！
sponsored
現地のカメラ映像を見ながら遠隔作業指示も。「オプテージ曽根崎データセンター（OC1）」の新サービス

人手不足のIT運用部門、その課題をOC1のデータセンター運用支援サービスが解決する
sponsored
リピーターの多さに納得のアフターサポートも必見

静音ゲーミングPCはもっと小型になる？個性派BTO PCの雄・サイコムに計画中の新製品からPCの寿命が延びるお掃除のコツまで訊いてきた
sponsored
JN-IPSM27G240Q-HSPをレビュー

4万円台の27型WQHDゲーミングディスプレー、240Hz・1ms・Mini LED・昇降式多機能スタンドの欲張り仕様なら余裕で買いでしょう
sponsored
アプライド仙台店が2月28日（土）オープン

アプライドがMSIノートPC導入を掲げて仙台へ。8年ぶりの新店が挑む「ネット時代の実店舗戦略」とは
sponsored
スマートバンド？スマートウォッチ？どっちにしてもGPS搭載でさらに便利になった！

約1万円でこれはもう本格スマートウォッチ！「HUAWEI Band 11 Pro」レビュー
sponsored
MSI「MPG 274URDFW E16M」レビュー

これが液晶最強クラスのゲーミングモニター！4K160HzとフルHD320Hzを瞬時に切り替えられるMini LEDのOLED級画質にひたすら感動した話
sponsored
12個のカスタム可能なボタンと2つのダイヤル、LCDディスプレーを搭載

え、Stream Deckがすぐ手元にあるってこんなに便利なの!? キーボードと合体した「GALLEON 100 SD」を試した
sponsored
進捗もリスク把握もレポート作成も！コツコツ記録した業務の情報が“組織の資産”に変わる！

まもなく登場！ Backlog AIアシスタントを試したら「できたらいいな」がサクッとできた
sponsored
Zoom活用事例：株式会社マクロミル

4500名規模のオンラインイベントと年100回のウェビナー　マクロミルのマーケティング施策を支えるZoom Webinars
sponsored
メンバーを無言にさせた3つの不安は仕組みで解消する

無言の会議が怖すぎる——心理的安全性を「仕組み」でつくり、お互いに指摘し高め合えるチームへ
sponsored
サイバー攻撃の侵入と拡大を根本から防ぐ“脱VPN”と「Fortinet ユニファイドZTNA」

「わずか3日」で狙われたVPNの脆弱性！対策が後手に回り500GBの情報漏洩… どうやったら防げた？
sponsored

メモリーの価格高騰でDDR4が再注目！あえて今DDR4で組むのは正解か？
sponsored

最速レビュー！ ASRockの新セグメント「Rock」シリーズマザーボードは、モダンですっきりとしたデザインながら快適すぎる⾃作体験を実現
sponsored
Crucialブランドで発売中のSSD製品を総まとめ！【外付モデル編】

【ありがとうCrucial】データを運ぶなら「信頼」を選びたい。最後に買っておくべきポータブルSSD総まとめ
sponsored
Crucialブランドで発売中のSSD製品を総まとめ！【内蔵モデル編】

【ありがとうCrucial】今こそ手に入れるべき、Micron品質の内蔵SSD総まとめ
sponsored
止まらないネットワークとセキュリティを融合　フォーティネット「FS-AXシリーズ」の目指す高み

安定性とセキュリティを両立　フォーティネットとアラクサラのシナジーには期待しかない
sponsored
ZEFT Z59Qの魅力をインタビュー

これはファンじゃなくても欲しくなる！CORSAIRづくしのゲーミングPC、タッチスクリーン付きの特別仕様も？
sponsored
STYLE-14FH128-U5-UCRXMをレビュー

大学生のPCはこれで決まり!? 4年保証で1kg未満の14型ノートPCが15万円台はこのご時世でお手頃すぎる
sponsored
JN-V100U-Mで「REANIMAL」をプレイ

元・廃校の体育館にて100型4Kディスプレー＆11.1.4chのサウンドバーで最新ホラーゲームをやってみると……
sponsored
IDOM CaaS Technology×TTS×ソフトバンクの協業で、社会課題に新たな解決策を作る

“車が必要なのに乗れない”人を救う「ノレル」　IoT×AIが実現した新たな自動車サービス
sponsored
創業10周年記念企画を密着レポート

JAPANNEXT、2025年に発表した171製品を校庭に全部並べて謎の料理・キョン汁で10周年を祝う
sponsored

富士通でこれなら満足、必要十分な性能を持つ12万円台ノートパソコン「FMV WE1-K3」（性能検証編）
sponsored
Zoom活用事例：トラムシステム株式会社

AI時代のコンタクトセンターを見据えて　「Zoom Virtual Agent」と共に進む通信サービス企業
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！