予測モデル開発自動化「SAS Factory Miner」と、テキスト分析「SAS Contextual Analysis」
機械学習によりデータ活用を強力支援、SASが2つの新製品
2015年08月26日 09時00分更新
SAS Institute Japanは8月25日、機械学習により予測モデル開発を自動化する「SAS Factory Miner」と、大量のテキストデータの分析(マイニング)に機械学習を適用する「SAS Contextual Analysis」という2つの新製品を発表した。これにより、同社の機械学習テクノロジー製品ポートフォリオが大幅に強化される。
大量の予測モデルを自動/高速に開発「SAS Factory Miner」
SAS Facroty Minerは、機械学習エンジンを搭載した予測モデリング自動化ソリューション。「SAS Enterprise Miner」のアドオン製品として、数百、数千もの予測モデルを高速に開発する必要のあるユーザーに適している。統計や数学の理論に詳しくないビジネスユーザーであっても、セルフサービス型のWebインタフェースから、精度の高い予測モデルを簡単かつ高速に自動作成できる。
SAS エンタープライズアナリティクス推進グループの辻氏は、エンタープライズにおける予測分析の需要と、その課題について説明した。
利用できるデータ量と処理能力の増大によって、予測分析にはより精緻な結果が求められるようになっている。しかし、求める結果がより精緻になるほど、必要な予測モデルの数も「指数的に」増えていく。
さらに、予測モデルの開発は複数の工程から成り、予測精度を高めるためにはこの試行を繰り返さなければならない。
したがって、こうした課題に対応するためには「工場のように、効率的に予測モデルを『生産』できる自動化ツール」が必要であると、辻氏は説明する。Factory Minerは、それを目標に開発された。
Factory Minerでは、モデル開発対象のデータを選択すると、データの(セグメントごとの)特性を自動計算し、最適な予測モデルが自動的に作成される。必要に応じてこれにチューニングを加え、最終的には最も精度の高い予測モデル(チャンピオンモデル)を導くことができる。
「従来は、ツールやスクリプトを使って予測モデルを『手作り』していたが、Factory Minerならばこれが工場生産のように、どんどん開発できる。しかも、最適なアルゴリズムが(自動的に)選ばれる。ビジネスユーザーの分析業務の生産性向上におけるブレイクスルーを実現する」(辻氏)
機械学習と人的判断とのタッグでテキスト分析「Contextual Analysis」
もう1つの新製品、SAS Contextual Analysisは、機械学習とルールベースという2つのアプローチを融合したテキスト分析ソリューションだ。事前の予備知識なしで、膨大なテキストデータのパターンやトレンド、分類のためのルールなどを自動抽出し、同時に精確な洞察も得ることができる。
SAS エンタープライズアナリティクス推進グループの津田氏は、テキストマイニングにおける2つのアプローチの違いを説明した。「機械学習アプローチ」は、自動化が可能で高速だが、結果精度が低い。他方「ルールベースアプローチ」は、結果は精確だがエキスパートによる手作業が求められる。
結局、2つのアプローチには「それぞれに善し悪しがある」ことから、Contextual Analysisではこれらを組み合わせた「ハイブリッドアプローチ」を実現したと、津田氏は語る。
具体的には、Contextual Analysisが大量のテキストデータを読み込むと、インメモリ機械学習テクノロジーによって「トピック」が自動抽出される。このとき、トピックとキーワードとの関連図、重要語の「ワードクラウド」も表示する。個々のドキュメントに対して、そのトピックスに対するセンチメント(評判がいい/悪い)の評価も行われる。
また、カテゴリ分類のためのルール(条件式)も自動作成される。このルールのさらに精度を高めたい場合には、ユーザーが手作業で変更を加えることができる。
実は機械学習テクノロジーを取り入れてきたSAS
SAS 執行役員の北川氏は、現在のビジネスでは「アナリティクス的なアプローチが企業の競争優位を得るためのカギ」となっており、特に適切な予測モデルの開発が企業の成功を左右すると説明した。しかしながら、そうしたモデルの開発や、モデルの業務への展開において時間をロスするようであれば、結局はビジネス価値も大きく損なってしまう。
そこで、SASでは機械学習の「アルゴリズム」と「自動化」の2点を重要視し、顧客にとって使いやすく、なおかつ精度の高い予測分析ソリューションを提供している。
「SASでは、これまであまり『機械学習』テクノロジーを前面に訴求してこなかったが、実はさまざまな製品で機械学習を取り入れている。今回の発表で、それをさらに拡張できた」(北川氏)