巧みに指示を出して規制を突破する手法
Q:「プロンプトインジェクション」ってなに?
A:対話型AIに対して、特定の指示(プロンプト)を出すことで実行する攻撃手法。
おすすめの関連記事
実はフィッシング詐欺だけで1年間に約120万件も報告されている
ある種の脆弱性を突いた攻撃と言える。特定の指示を受けたAIシステムは開発者が想定していない動作をしてしまい、誤動作してしまう。
その結果、攻撃者はAIから本来公開するべきでない情報を引き出すことが可能になり、対話型AIを運用している企業の機密情報や従業員のパスワードなどが漏洩する危険性もある。
実際、2022年9月にはGPT-3エンジンを採用した対話型AIに対して「前の指示を無視せよ」と指示を出したことでAIから非公開のドキュメントを引き出したり、SQLインジェクションを実行したりした事例が報告されており、対話型AIの普及に伴ってプロンプトインジェクションは必ず対策すべき課題となっている。
具体的な対策としては、ユーザーからの入力をチェック、フィルタリングすることで、悪意あるプロンプトを防ぐこと、またAIモデルの開発においてプロンプトインジェクションに対する耐性を与える設計をすることが挙げられる。

この連載の記事
-
第112回
デジタル
パスワードの使い回しを防ぐ「ヒントシート」は古のパスワード管理術 -
第111回
デジタル
AIを頭良くする「ディープラーニング」技術はセキュリティ分野でも大活躍 -
第110回
デジタル
帰宅後は私物PCで仕事を続行……「シャドーIT」って大丈夫なの? -
第109回
デジタル
お化けにお金を盗まれた!? タッチ決済に潜む「ゴーストタッピング」の恐怖 -
第108回
デジタル
「スミッシング」はSMSを使ったフィッシング詐欺のこと! -
第107回
デジタル
「生体認証」はパスワードが破られるAI時代に必須の仕組み -
第106回
デジタル
「セキュリティーポリシー」とは企業の情報資産を守るためのルール -
第105回
デジタル
狙い撃つぜ!「標的型メール攻撃」は企業に侵入するための第一歩 -
第104回
デジタル
ゴミ箱漁りも立派なハッキングです!「ソーシャルエンジニアリング」って何? -
第103回
デジタル
「VPN」は無料ではなく有償サービスを選ぶべき! なぜかと言えば…… -
第102回
デジタル
アサヒやアスクルの被害で再び注目「ランサムウェア」ってなに? - この連載の一覧へ

