このページの本文へ

毒をもって毒を制す——LLMの有害行動を防ぐ意外な新手法

2025年08月06日 06時59分更新

文● Grace Huckins

大規模言語モデル（LLM）は時に、悪意のある返答を返すことがある。アンソロピック（Anthropic）が発見したのは「毒をもって毒を制す」手法だった。訓練中に悪意や追従性を意図的に活性化させることで、逆にモデルがそれらの特性を獲得するのを阻止できるという。

【この続きをMITテクノロジーレビューで読む】

ツイートする

カテゴリートップへ

ビジネス最新連載・特集一覧

【2026年提出】確定申告ガイド

【2026年提出確定申告】「空の領収書」は脱税? 税務署バレする?
柳谷智宣の「簡単すぎて驚く生成AIの使い方」

通勤時間やスキマ時間を事前学習時間として有効活用！　NotebookLM音声解説機能のおすすめプロンプト
柳谷智宣のkintoneマスターへの道

自治体の給付金業務が滞るのを事前審査自動化で救う　トヨクモクラウドコネクトの申請補助AI
連載：今週の「ざっくり知っておきたいIT業界データ」

「アプリ内製化／市民開発ニーズ」をつかんだChatGPT／地政学的緊張で「クラウド国内回帰」進む／AIによる生産性向上は「見せかけ」だけ？、ほか
松本典子の「はじめよう！Azure Logic Apps／Power Automateでノーコード／ローコード」

顧客管理をラクに！リストに顧客情報が入力されたら自動でフォルダーを新規作成する
業務を変えるkintoneユーザー事例

給与20%増達成で社員の人生も変えた　平均年齢64歳の地方バス・タクシー会社はkintoneで未来をつなぐ
スタートアップのスタート地点

リケジョが活躍する丸の内の最先端ラボ　多くの社会課題を解決する可能性を秘めるナノシートの社会実装に挑む「ディメンジョンフォー」
大谷イビサのIT業界物見遊山

AI確定申告の気運高まる　申告者はチェックして、あとは「告る」のみへ
【2025年提出】確定申告ガイド

【2025年提出】確定申告を間違えた場合の対処法
最新ユーザー事例探求

リード発掘の秘訣は「ベテラン営業の知見×法人DB」 USEN ICT Solutionsにおける営業DXの歩み

ピックアップ

sponsored

最速レビュー！ ASRockの新セグメント「Rock」シリーズマザーボードは、モダンですっきりとしたデザインながら快適すぎる⾃作体験を実現
sponsored
Crucialブランドで発売中のSSD製品を総まとめ！【外付モデル編】

【ありがとうCrucial】データを運ぶなら「信頼」を選びたい。最後に買っておくべきポータブルSSD総まとめ
sponsored
Crucialブランドで発売中のSSD製品を総まとめ！【内蔵モデル編】

【ありがとうCrucial】今こそ手に入れるべき、Micron品質の内蔵SSD総まとめ
sponsored
止まらないネットワークとセキュリティを融合　フォーティネット「FS-AXシリーズ」の目指す高み

安定性とセキュリティを両立　フォーティネットとアラクサラのシナジーには期待しかない
sponsored
ZEFT Z59Qの魅力をインタビュー

これはファンじゃなくても欲しくなる！CORSAIRづくしのゲーミングPC、タッチスクリーン付きの特別仕様も？
sponsored
STYLE-14FH128-U5-UCRXMをレビュー

大学生のPCはこれで決まり!? 4年保証で1kg未満の14型ノートPCが15万円台はこのご時世でお手頃すぎる
sponsored
JN-V100U-Mで「REANIMAL」をプレイ

元・廃校の体育館にて100型4Kディスプレー＆11.1.4chのサウンドバーで最新ホラーゲームをやってみると……
sponsored
IDOM CaaS Technology×TTS×ソフトバンクの協業で、社会課題に新たな解決策を作る

“車が必要なのに乗れない”人を救う「ノレル」　IoT×AIが実現した新たな自動車サービス
sponsored
創業10周年記念企画を密着レポート

JAPANNEXT、2025年に発表した171製品を校庭に全部並べて謎の料理・キョン汁で10周年を祝う
sponsored
FREX∀RブランドのFRZAB850W/985をレビュー

Ryzen 7 9850X3DでARC Raidersも超快適なゲーミングPC、標準3年保証も魅力的
sponsored
LEVEL-M5A6-R96X-RKX-FB [RGB Build]をレビュー

父ノ背中ファンやゲーミングPC入門者にもオススメのRyzen＆RTX 5060搭載ピラーレスミニタワー
sponsored
Zoom活用事例：富士ソフトサービスビューロ株式会社

「もう、好評としか言いようがない」コールセンターの現場ニーズをすべて満たしたZoomの導入
sponsored

新色グレーが映える！ ASRockの電源ユニット「SL-1200P」はUSB電力の安定供給とNTCセンサーで高負荷も安心
sponsored

富士通でこれなら満足、必要十分な性能を持つ12万円台ノートパソコン「FMV WE1-K3」（性能検証編）
sponsored

富士通キーボードの打ち心地抜群！　12万円台のお手頃15.6型モバイルノート「FMV WE1-K3」がいい
sponsored

最強クラスのオーバークロック仕様！ 14万円前後で手に入るRadeon RX 9070 XTが3060MHzブーストで高性能ゲーミングを実現
sponsored
Radiant SDM3300X600A、Lepton Mini B860i、Premium Line Mini B850FD/T/A

容量15L未満の小さいゲーミングPCならコレ！こだわり派が選ぶサイコム製BTO PCのおすすめベスト3
sponsored
Zoom活用事例：トラムシステム株式会社

AI時代のコンタクトセンターを見据えて　「Zoom Virtual Agent」と共に進む通信サービス企業
sponsored

iPhone 17時代の必携アイテム！25W MagSafe対応の急速充電器「Belkin UltraCharge マグネットチャージャー25W」レビュー
sponsored
MSI「MAG X870E TOMAHAWK MAX WIFI PZ」レビュー

2026年にRyzenでゲーミングPCを自作するなら、マザーボードとグラボとケースはこの組み合わせが正解。徹底した白とケーブル排除で初心者でも組みやすい！
sponsored
MSI「MPG 271QR QD-OLED X50」レビュー

液晶を圧倒するOLEDと500Hz駆動がもたらす至高のゲーミング世界。これがゲーミングモニターのフラグシップか！と感動すら覚えた実機レビュー
sponsored
人気イヤホンの第2世代モデルは軽量コンパクト化、音質向上、チップセット強化で登場！

オープンイヤー型イヤホンのヒット商品に新モデル！「HUAWEI FreeClip 2」の魅力に迫る！
sponsored
“全員参加”のチームづくりでリーダーが気をつけるべきこと、Backlogを役立てる方法

プロジェクトリーダーを悩ませる“指示待ちメンバー”　自発的な行動を促すコミュニケーション術を考える
sponsored
ZEFT R67CのOSなしモデルにインストール

ゲーミングPCが高くなってきたので無料で使えるゲーム特化OS「Bazzite」で節約してみた【導入方法を解説】
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！

ASCII.jpからのお知らせ