このページの本文へ

前へ 1 2 次へ

攻撃シナリオの作成、防御策の立案や評価を自動化、「マルチAIエージェントセキュリティ技術」発表

異なるAIがサイバー攻撃／防御／評価を分担して実行、最適な防御策に導く―富士通の新技術

2024年12月17日 07時30分更新

文● 大河原克行　編集● 大塚／TECH.ASCII.jp

不正なプロンプトによるLLM攻撃を防ぐ「生成AIセキュリティ強化技術」も発表

　もうひとつ発表されたのが、イスラエルのベングリオン大学との共同開発による「生成AIセキュリティ強化技術」だ。具体的には、生成AI（LLM：大規模言語モデル）のセキュリティ耐性を自動チェックする「LLM脆弱性スキャナー」、攻撃を自動的に防御／緩和する「LLMガードレール」により構成される。

「生成AIセキュリティ強化技術」の概要

　生成AIを組み込んだシステムが急速に普及する一方で、生成AIに不正な命令（プロンプト）を与えて意図しない動作をさせる「プロンプトインジェクション」などの新たな攻撃手法も登場している。こうした脆弱性を発見するのがLLM脆弱性スキャナー、発見された脆弱性への対策を適用するのがLLMガードレールだ。ここでは前述した3種類のAIエージェントが活用される。

　LLM脆弱性スキャナーでは、同社が蓄積した3500以上のLLM脆弱性データベースに基づいて、攻撃AIエージェントが「攻撃プロンプト」を作成。これを生成AIシステムに送信し、得られた回答をテストAIエージェントが評価する。こうした仕組みにより、人手によるテストでは検出が困難なLLMの脆弱性を、高精度に検出できるという。また、脆弱性のチェック結果はダッシュボードで可視化され、セキュリティの専門家ではない開発者であっても、どのようなリスクがあるのかを容易に確認できる。

　またLLMガードレールは、LLM脆弱性スキャナーが検出した脆弱性の情報に基づき、LLMが不適切な回答をしうる攻撃プロンプトを拒絶する「ガード規則」を自動作成することで、リスクを抑止する。

　この生成AIセキュリティ強化技術については、2024年12月からCohereと技術実証を開始し、将来的には富士通が開発するLLM「Takane」へも展開する方針だ。

「LLM脆弱性スキャナー」が作成した不適切なプロンプトを、「LLMガードレール」がブロックするイメージ（画像はFUJITSU TECH BLOGより）

なお、富士通におけるAIエージェントの技術の進化や適用範囲の拡大についても紹介された

■関連サイト

前へ 1 2 次へ

ツイートする

カテゴリートップへ

ITトピック
“日本語性能世界一”の企業利用に特化したLLM「Takane」、富士通が提供開始
ビジネス
富士通、AIを“バディ”としてFujitsu Uvanceに融合
ITトピック
世界一を目指す5つのキーテクノロジー　富士通が最新の研究成果を披露

注目ニュース

アクセスランキング

集計期間：: 2024年12月12日~2024年12月18日

TECH 最新連載・特集一覧

FIXER Tech Blog - FIXER

大盛況！デジタル庁や金融機関のGaiXer事例を紹介した「AI・人工知能EXPO 2024秋」セミナーレポート（前編）
連載：今週の「ざっくり知っておきたいIT業界データ」

進まないアプリケーションのモダナイズ／転職で稼げるプログラミング言語は／賃上げに「満足」は半数に満たず、ほか
FIXER Tech Blog - Cloud

初心者向け：RDSスナップショットを別のAWSアカウントで復元する手順
FIXER Tech Blog - AI/Machine Learning

自治体業務でどう使う？生成AIアイデアソンに自治体職員が挑戦
FIXER Tech Blog - Development

業務で使えるExcel関数テクニック − 関数を使った動的な範囲指定のコツ
松本典子の「はじめよう！Azure Logic Apps／Power Automateでノーコード／ローコード」

契約書を確実に期限管理！ SharePoint＋Power Automateで期日通知を自動化
FIXER Tech Blog - Azure

データ分析を楽しみながら学ぼう！ Microsoft Fabricコミュニティとは
連載：「おしゃべりな機械」たちの世界へようこそ！

スマートリモコンは、なぜ外出先からでも操作できるのか？
業務を変えるkintoneユーザー事例

これからは“攻めの情シス”で行こう！　上司の一言でkintone伴走支援班は突っ走れた
「Oracle CloudWorld 2024」レポート

分散クラウドからソブリンAIへ、“先行他社とは違う”オラクルOCIの戦略とは

ASCII.jpからのお知らせ