このページの本文へ

機械学習でサイバー犯罪者もパワーアップする!?

2017年02月17日 09時00分更新

文● せきゅラボ

  • この記事をはてなブックマークに追加
  • 本文印刷

 マシン ラーニング(機械学習)が身近なトピックになっている。2016年3月、Google DeepMindが開発した「AlphaGo」が囲碁の対局でトップ棋士に勝利したのは、世界中で大きな話題となったこともあり、覚えている人も多いだろう。

 エンターテイメントの分野だけでなく、我々の生活の中でもマシン ラーニングは有効活用されている。たとえば通販サイトなら、「あわせて買いたい」などと、製品のデータベースからその顧客が興味を持って購入しそうな製品を紹介することができる。家電やスマートフォンでも、文字認識や音声認識などの精度を上げるために不可欠な技術だ。

 しかし、なぜ今、マシン ラーニングが普及しているのか?

 まず、インターネットにより、学習用途に利用できるデータが入手しやすくなったことが大きい。また、膨大なデータを高速で並列処理できるGPUが普及したほか、クラウドサービスを活用して大量のコンピューターリソースを一度に利用できるようになったことも見逃せない。

 ただし、マシン ラーニングが利用しやすくなったということは、悪意を持った攻撃者が、それを使う可能性が高くなったとも考えられる。

 マシン ラーニングのツールキットやチュートリアルが幅広く普及し、誰でも複雑なデータを解析できるようになった。つまり、サイバー犯罪者も、強力な機械学習の技術を利用しやすくなっているのだ。もし彼らが不正に入手した記録や個人情報などを解析できれば、標的を特定したうえで情報を悪用することはもちろん、標的をあざむきやすい攻撃方法(たとえばスパムメールなど)を作ることも可能になるだろう。

 一方、セキュリティーの現場ではどうか。マシン ラーニングは、既存の脅威を検出するだけでなく、未知の脅威にも対処しやすくする有用な武器になりうる。たとえば、マルウェアの挙動を大量に学習させることで、「これはマルウェアだ」とわかるだけでなく、「これは未知のものだが、どうもマルウェアのような動きをしている」と気づけるようになる。

 また、クレジットカードで不正取引と思われる履歴を発見したときなどは、「この取引は過去の購入履歴からすれば、不自然だ」と判断できるようにもなる。機械学習を活用したセキュリティー対策も、急速に普及しているのだ。

 マシン ラーニングを取り巻く環境は日々進歩している。今回はMcAfee Blogの「今だから学ぶ! セキュリティの頻出用語」から「マシン ラーニング(機械学習)」について解説するエントリーを紹介しよう。

今だから学ぶ! マシン ラーニングについて

 「セキュリティに対する重要性は理解したけれど、用語が難しくて」という声を聞くことがよくあります。そんな方に、「今だから学ぶ!」と題して、連載でセキュリティの頻出用語を解説します。第42回は、「マシン ラーニング(機械学習)」についてです。

 マシン ラーニング(機械学習、Machine Learning)は、人工知能(Artificial Intelligence, AI) における一つの分野です。この数年、AIおよびマシン ラーニングに関する研究が急速な成長を遂げ、さまざまな企業・組織がマシン ラーニングを利用した製品やサービスを提供しています。2016年3月には、Google DeepMind社が開発したAlphaGoが囲碁の対局でトップ棋士に勝つなど、世界中で大きな話題となりました。

 この背景には、インターネットの普及により、学習用途に利用できるイメージ、テキストデータなどが入手しやすくなったこと、あらゆる種類の膨大なデータを高速で安価に並列処理できるGPU(Graphics Processing Unit) が普及したこと、クラウドサービスを活用することで大量のコンピュータリソースを一度に利用できるようになったことなどがあります。

 マシン ラーニングを利用した製品やサービスは、身近なものとなっています。いくつか応用例を紹介します。

応用例:

 レコメンデーション: アマゾンのショッピングサイトにあるような、ある顧客の購買履歴を基にして、製品データベースからその顧客が興味を持って購入しそうな製品をレコメンド(推奨)するというものです。レコメンドのベースとなるデータには、購買履歴以外にも、よく似た購買傾向を示す別の顧客の購買履歴を利用することもあります。
 数字・文字認識:例えば、はがきに郵便番号が手書きで書いてあると、その手書き文字の数字を認識し、地域ごとに仕分けることができます。
 音声認識: 例えば、 人の声などを認識して、その人が話をした内容(質問や要望など)を理解し、それらに対して応えようとします。近年、家庭用家電で音声認識を利用したサービスを提供するものが増えています。

 その他にも、医療診断、株式市場の予測、機械の故障予測、コールセンターでの問い合わせ対応など幅広い分野で利用されています。

 もちろん、セキュリティ分野においても活用が進んでいます。

 マルウェアの分析
 アンチウィルスソフトウェアは、マルウェアの検出スピードの改善や検出率を向上させるために、マシン ラーニングを利用する例が増えています。例えば、インテル セキュリティでは、動的エンドポイント脅威対策の1つとして、エンドポイントで強力なマシン ラーニングとアプリケーション隔離ツールを使用し、高度な脅威を検出してブロックします。プロセスの挙動を追跡し、未知の脅威を数秒で検出します。
 クレジットカード不正検知
 ある顧客のクレジットカード取引履歴をみて、それらの取引がその顧客によって行われたかどうかを過去の振る舞い等から識別します。

 このようにマシン ラーニングを利用してセキュリティーソリューションを強化する動きが進む一方で、McAfee Labs 「2017年の脅威予測」では、攻撃側であるサイバー犯罪者もマシン ラーニングを利用することで能力を高めることを予測しています。

 “マシン ラーニング ツールキットやチュートリアルが幅広く普及し、ほぼ誰にでも複雑なデータセットを解析することが可能になりました。サイバー犯罪者は強力なマシン ラーニング技術を利用し、ソーシャル エンジニアリング攻撃の精度を高めています。そして、2015年から、組織内の財務管理者を狙う攻撃が増えており、犯罪者は盗んだ大量の記録や個人情報を解析して標的を特定したうえで、騙すための内容を詳しく記載したeメールを作成し、被害者を非常に効果的に欺くであろうと予想されています。”

【関連記事】
McAfee Labs 2017年の脅威予測

第5回:今だから学ぶ! セキュリティの頻出用語 : マルウェアとは?
第8回:今だから学ぶ! セキュリティの頻出用語 : ソーシャルエンジニアリングとは?
第9回:今だから学ぶ! セキュリティの頻出用語 : エンドポイント セキュリティとは?

カテゴリートップへ