このページの本文へ

LLMでLLMの「脱獄」防げ、アンソロピックが防御策で新手法

2025年02月05日 06時55分更新

文● Will Douglas Heaven

アンソロピックが、大規模言語モデルの不正利用を防ぐ新手法を開発した。悪意ある指示への応答を遮断する防御壁により、「脱獄」の成功率を86%から4.4%に抑制することに成功している。

【この続きをMITテクノロジーレビューで読む】

ツイートする

カテゴリートップへ

ビジネス最新連載・特集一覧

あなたが買うべきガジェットは俺たちに選ばせてくれ！推しガジェット大賞 2026

まさかのAnkerがムダ会議の撲滅に殴り込み！生産性が爆上がる新製品を試してみた
松本典子の「はじめよう！Azure Logic Apps／Power Automateでノーコード／ローコード」

実はできる！ Power Automateでテーブル設定済みのExcelファイルを新規作成する方法
【2026年提出】確定申告ガイド

【2026年提出確定申告】3月16日締切！郵送の場合「消印」はいつ?
連載：今週の「ざっくり知っておきたいIT業界データ」

AIで崩壊するサイバー恐喝犯罪の「参入障壁」／IT専攻卒業生、女性比率は先進国で最下位／AIがつく“うそ”対処法、ほか
柳谷智宣の「簡単すぎて驚く生成AIの使い方」

スマホからChatGPTをバリバリ使い倒す！　スキマ時間が有効に活用できるChatGPTスマホアプリ
ゆるっと知見を深める楽しい会「TECH.ASCII ゆるっとナイト」

情シスの“ホンネ”ここまで聞けていいの？　ゆるっとナイトの「ランサムウェア回」が盛り上がりすぎた
柳谷智宣のkintoneマスターへの道

自治体の給付金業務が滞るのを事前審査自動化で救う　トヨクモクラウドコネクトの申請補助AI
業務を変えるkintoneユーザー事例

給与20%増達成で社員の人生も変えた　平均年齢64歳の地方バス・タクシー会社はkintoneで未来をつなぐ
スタートアップのスタート地点

リケジョが活躍する丸の内の最先端ラボ　多くの社会課題を解決する可能性を秘めるナノシートの社会実装に挑む「ディメンジョンフォー」
大谷イビサのIT業界物見遊山

AI確定申告の気運高まる　申告者はチェックして、あとは「告る」のみへ

ピックアップ

sponsored
「Satechi OntheGo 7 in 1 マルチポートアダプター」レビュー

業務必須の7ポートをギュッとまとめたUSB Type-Cモバイルハブ「OntheGo」が買いだ！
sponsored

AMDのゲームテクノロジーセット「FSR “Redstone”」解説。新GPUが出なくてもソフトは劇的に進化する
sponsored

大きさ1.5倍はそのまま、食べて「おっ！」ファミマの「大きなおむすび」に意外な変化
sponsored
斬新ながらインテリアに溶け込むデザイン　最新のWi-Fi 7対応で性能も十分！

こんな“魅せまくる”Wi-Fiルーターってあった？ファーウェイの「HUAWEI WiFi Mesh X3 Pro」が美しすぎる
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

be quiet!の静音設計パーツを使いまくったら、ものすご〜く静かなゲーミングPCが完成するのでは？
sponsored
「デジタル資産×現場データ」の勝利の方程式とは？

フィジカルとAIをつなぐOODAループはもう実装可能　ソラコムとセンシンロボティクスが語る「リアルワールドAIプラットフォーム」
sponsored
マウスコンピューター「mouse K7-I7G50BK-A」

年度末のこの時期はPC買うべし！場所を取らずに大画面、32GBメモリー搭載の17.3型ノートがオトクなセール中
sponsored
マウスコンピューターのゲーミングPC「G TUNE FZ-I7G80」がセール中

【ゲーミングPCが7万円オフ】憧れのスペック（Core Ultra 7＋GeForce RTX 5080）の1台が今ならオトク！
sponsored

1リットルの衝撃、手のひらサイズに凝縮されたNVIDIA RTXのパワー！　プロが託す信頼の「ThinkStation P3 Tiny Gen 2」
sponsored
じゃんけん大会は400人参加!!

東北初出店のアプライド仙台店スゴすぎ！初日で約3000人来店したオープンイベントで1日店員してきた話
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

パソコンショップSEVENの強化ガラス製ピラーレスの白いゲーミングPCがかっこいい。触りにきませんか？
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

サイコムさんが、とあるイベント来場で1TB SSDを2TBに無償でアップグレードしてくれるらしいんですけど……！
sponsored
現地のカメラ映像を見ながら遠隔作業指示も。「オプテージ曽根崎データセンター（OC1）」の新サービス

人手不足のIT運用部門、その課題をOC1のデータセンター運用支援サービスが解決する
sponsored
リピーターの多さに納得のアフターサポートも必見

静音ゲーミングPCはもっと小型になる？個性派BTO PCの雄・サイコムに計画中の新製品からPCの寿命が延びるお掃除のコツまで訊いてきた
sponsored
JN-IPSM27G240Q-HSPをレビュー

4万円台の27型WQHDゲーミングディスプレー、240Hz・1ms・Mini LED・昇降式多機能スタンドの欲張り仕様なら余裕で買いでしょう
sponsored
アプライド仙台店が2月28日（土）オープン

アプライドがMSIノートPC導入を掲げて仙台へ。8年ぶりの新店が挑む「ネット時代の実店舗戦略」とは
sponsored
スマートバンド？スマートウォッチ？どっちにしてもGPS搭載でさらに便利になった！

約1万円でこれはもう本格スマートウォッチ！「HUAWEI Band 11 Pro」レビュー
sponsored
MSI「MPG 274URDFW E16M」レビュー

これが液晶最強クラスのゲーミングモニター！4K160HzとフルHD320Hzを瞬時に切り替えられるMini LEDのOLED級画質にひたすら感動した話
sponsored
12個のカスタム可能なボタンと2つのダイヤル、LCDディスプレーを搭載

え、Stream Deckがすぐ手元にあるってこんなに便利なの!? キーボードと合体した「GALLEON 100 SD」を試した
sponsored
進捗もリスク把握もレポート作成も！コツコツ記録した業務の情報が“組織の資産”に変わる！

まもなく登場！ Backlog AIアシスタントを試したら「できたらいいな」がサクッとできた
sponsored
Zoom活用事例：株式会社マクロミル

4500名規模のオンラインイベントと年100回のウェビナー　マクロミルのマーケティング施策を支えるZoom Webinars
sponsored
メンバーを無言にさせた3つの不安は仕組みで解消する

無言の会議が怖すぎる——心理的安全性を「仕組み」でつくり、お互いに指摘し高め合えるチームへ
sponsored
サイバー攻撃の侵入と拡大を根本から防ぐ“脱VPN”と「Fortinet ユニファイドZTNA」

「わずか3日」で狙われたVPNの脆弱性！対策が後手に回り500GBの情報漏洩… どうやったら防げた？
sponsored

メモリーの価格高騰でDDR4が再注目！あえて今DDR4で組むのは正解か？
sponsored

最速レビュー！ ASRockの新セグメント「Rock」シリーズマザーボードは、モダンですっきりとしたデザインながら快適すぎる⾃作体験を実現
sponsored
Crucialブランドで発売中のSSD製品を総まとめ！【外付モデル編】

【ありがとうCrucial】データを運ぶなら「信頼」を選びたい。最後に買っておくべきポータブルSSD総まとめ
sponsored
Crucialブランドで発売中のSSD製品を総まとめ！【内蔵モデル編】

【ありがとうCrucial】今こそ手に入れるべき、Micron品質の内蔵SSD総まとめ
sponsored
止まらないネットワークとセキュリティを融合　フォーティネット「FS-AXシリーズ」の目指す高み

安定性とセキュリティを両立　フォーティネットとアラクサラのシナジーには期待しかない
sponsored
ZEFT Z59Qの魅力をインタビュー

これはファンじゃなくても欲しくなる！CORSAIRづくしのゲーミングPC、タッチスクリーン付きの特別仕様も？
sponsored
STYLE-14FH128-U5-UCRXMをレビュー

大学生のPCはこれで決まり!? 4年保証で1kg未満の14型ノートPCが15万円台はこのご時世でお手頃すぎる
sponsored
JN-V100U-Mで「REANIMAL」をプレイ

元・廃校の体育館にて100型4Kディスプレー＆11.1.4chのサウンドバーで最新ホラーゲームをやってみると……
sponsored
IDOM CaaS Technology×TTS×ソフトバンクの協業で、社会課題に新たな解決策を作る

“車が必要なのに乗れない”人を救う「ノレル」　IoT×AIが実現した新たな自動車サービス
sponsored
創業10周年記念企画を密着レポート

JAPANNEXT、2025年に発表した171製品を校庭に全部並べて謎の料理・キョン汁で10周年を祝う
sponsored
FREX∀RブランドのFRZAB850W/985をレビュー

Ryzen 7 9850X3DでARC Raidersも超快適なゲーミングPC、標準3年保証も魅力的
sponsored
Zoom活用事例：富士ソフトサービスビューロ株式会社

「もう、好評としか言いようがない」コールセンターの現場ニーズをすべて満たしたZoomの導入
sponsored

富士通でこれなら満足、必要十分な性能を持つ12万円台ノートパソコン「FMV WE1-K3」（性能検証編）
sponsored
Zoom活用事例：トラムシステム株式会社

AI時代のコンタクトセンターを見据えて　「Zoom Virtual Agent」と共に進む通信サービス企業
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！

ASCII.jpからのお知らせ