巧みに指示を出して規制を突破する手法
Q:「プロンプトインジェクション」ってなに?
A:対話型AIに対して、特定の指示(プロンプト)を出すことで実行する攻撃手法。
おすすめの関連記事
実はフィッシング詐欺だけで1年間に約120万件も報告されている
ある種の脆弱性を突いた攻撃と言える。特定の指示を受けたAIシステムは開発者が想定していない動作をしてしまい、誤動作してしまう。
その結果、攻撃者はAIから本来公開するべきでない情報を引き出すことが可能になり、対話型AIを運用している企業の機密情報や従業員のパスワードなどが漏洩する危険性もある。
実際、2022年9月にはGPT-3エンジンを採用した対話型AIに対して「前の指示を無視せよ」と指示を出したことでAIから非公開のドキュメントを引き出したり、SQLインジェクションを実行したりした事例が報告されており、対話型AIの普及に伴ってプロンプトインジェクションは必ず対策すべき課題となっている。
具体的な対策としては、ユーザーからの入力をチェック、フィルタリングすることで、悪意あるプロンプトを防ぐこと、またAIモデルの開発においてプロンプトインジェクションに対する耐性を与える設計をすることが挙げられる。

この連載の記事
-
第100回
デジタル
もうすぐ始まる「スマホ新法」で何が変わる? 便利な機能が削られる可能性も -
第99回
デジタル
今さら聞けないセキュリティ単語筆頭!? 「フィッシング詐欺」ってなに? -
第98回
デジタル
「ブラックフライデー」は毎年11月に「お買い得と詐欺」をもたらすカオスなシーズン -
第97回
デジタル
今一番怖いのは認証画面!? 「クリックフィックス(ClickFix)」への対策はPC知識を学ぶことかも -
第96回
デジタル
極小枠に広告を多重表示!? 貴重な広告費が無駄になる「アドフラウド」って何? -
第95回
デジタル
被害額560億円超! 暗号資産から裸の映像まで騙し取る「ニセ警察詐欺」が怖い -
第94回
デジタル
AIに仕事を任せたら社外秘を盗まれる!?「間接的プロンプトインジェクション」の脅威 -
第93回
デジタル
激安で商品を買ったはずなのに中身が違う! 「代引き詐欺」に遭わない対策は? -
第92回
デジタル
流行りのニセ警察詐欺も! 「特殊詐欺」って何が特殊なの? -
第91回
デジタル
「フィッシング詐欺ではない」ことを示す目印「BIMI」はどうやって使う? -
第90回
デジタル
サイバー攻撃からダメ学生あぶり出しまで「ステルスプロンプト」の威力とは? - この連載の一覧へ

