このページの本文へ

LLMでLLMの「脱獄」防げ、アンソロピックが防御策で新手法

2025年02月05日 06時55分更新

文● Will Douglas Heaven

  • この記事をはてなブックマークに追加
  • 本文印刷

アンソロピックが、大規模言語モデルの不正利用を防ぐ新手法を開発した。悪意ある指示への応答を遮断する防御壁により、「脱獄」の成功率を86%から4.4%に抑制することに成功している。

カテゴリートップへ

  • 角川アスキー総合研究所

MSIが変える、未来のクリエイターを育てる教育環境

アスキー・ビジネスセレクション

ピックアップ