このページの本文へ

予測モデル開発自動化「SAS Factory Miner」と、テキスト分析「SAS Contextual Analysis」

機械学習によりデータ活用を強力支援、SASが2つの新製品

2015年08月26日 09時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 SAS Institute Japanは8月25日、機械学習により予測モデル開発を自動化する「SAS Factory Miner」と、大量のテキストデータの分析(マイニング)に機械学習を適用する「SAS Contextual Analysis」という2つの新製品を発表した。これにより、同社の機械学習テクノロジー製品ポートフォリオが大幅に強化される。

SAS 執行役員 マーケティング本部 兼 ビジネス推進本部本部長、北川裕康氏

SAS ソリューションコンサルティング第一本部 エンタープライズアナリティクス推進グループ アナリティクスビジネス開発 シニアマネージャー、辻仁史氏

SAS ソリューションコンサルティング第一本部 エンタープライズアナリティクス推進グループ アナリティクスビジネス開発 担当部長、津田高治氏

2つの新製品追加により、機械学習をサポートするSASの製品ポートフォリオが強化された

大量の予測モデルを自動/高速に開発「SAS Factory Miner」

 SAS Facroty Minerは、機械学習エンジンを搭載した予測モデリング自動化ソリューション。「SAS Enterprise Miner」のアドオン製品として、数百、数千もの予測モデルを高速に開発する必要のあるユーザーに適している。統計や数学の理論に詳しくないビジネスユーザーであっても、セルフサービス型のWebインタフェースから、精度の高い予測モデルを簡単かつ高速に自動作成できる。

 SAS エンタープライズアナリティクス推進グループの辻氏は、エンタープライズにおける予測分析の需要と、その課題について説明した。

 利用できるデータ量と処理能力の増大によって、予測分析にはより精緻な結果が求められるようになっている。しかし、求める結果がより精緻になるほど、必要な予測モデルの数も「指数的に」増えていく。

期待する予測結果が複雑(精緻)なものになるほど、必要な予測モデルの数も指数的に増えていく。人手によるモデル開発で対応するには限界がある

 さらに、予測モデルの開発は複数の工程から成り、予測精度を高めるためにはこの試行を繰り返さなければならない。

予測モデルの開発プロセスは幾つものステップを踏む。しかも精度を高めていくためには試行を繰り返さなければならない

 したがって、こうした課題に対応するためには「工場のように、効率的に予測モデルを『生産』できる自動化ツール」が必要であると、辻氏は説明する。Factory Minerは、それを目標に開発された。

 Factory Minerでは、モデル開発対象のデータを選択すると、データの(セグメントごとの)特性を自動計算し、最適な予測モデルが自動的に作成される。必要に応じてこれにチューニングを加え、最終的には最も精度の高い予測モデル(チャンピオンモデル)を導くことができる。

 「従来は、ツールやスクリプトを使って予測モデルを『手作り』していたが、Factory Minerならばこれが工場生産のように、どんどん開発できる。しかも、最適なアルゴリズムが(自動的に)選ばれる。ビジネスユーザーの分析業務の生産性向上におけるブレイクスルーを実現する」(辻氏)

機械学習と人的判断とのタッグでテキスト分析「Contextual Analysis」

 もう1つの新製品、SAS Contextual Analysisは、機械学習とルールベースという2つのアプローチを融合したテキスト分析ソリューションだ。事前の予備知識なしで、膨大なテキストデータのパターンやトレンド、分類のためのルールなどを自動抽出し、同時に精確な洞察も得ることができる。

 SAS エンタープライズアナリティクス推進グループの津田氏は、テキストマイニングにおける2つのアプローチの違いを説明した。「機械学習アプローチ」は、自動化が可能で高速だが、結果精度が低い。他方「ルールベースアプローチ」は、結果は精確だがエキスパートによる手作業が求められる。

テキストマイニングの2大アプローチ、機械学習とルールベース。それぞれに一長一短がある

 結局、2つのアプローチには「それぞれに善し悪しがある」ことから、Contextual Analysisではこれらを組み合わせた「ハイブリッドアプローチ」を実現したと、津田氏は語る。

Contextual Analysisでは2つのアプローチを組み合わせ、迅速かつ精度の高いテキスト分析を実現する

 具体的には、Contextual Analysisが大量のテキストデータを読み込むと、インメモリ機械学習テクノロジーによって「トピック」が自動抽出される。このとき、トピックとキーワードとの関連図、重要語の「ワードクラウド」も表示する。個々のドキュメントに対して、そのトピックスに対するセンチメント(評判がいい/悪い)の評価も行われる。

 また、カテゴリ分類のためのルール(条件式)も自動作成される。このルールのさらに精度を高めたい場合には、ユーザーが手作業で変更を加えることができる。

テキストのカテゴリ分類ルールは自動生成されるが、それに人手を加えることでさらに精度を高めていくことが可能

実は機械学習テクノロジーを取り入れてきたSAS

 SAS 執行役員の北川氏は、現在のビジネスでは「アナリティクス的なアプローチが企業の競争優位を得るためのカギ」となっており、特に適切な予測モデルの開発が企業の成功を左右すると説明した。しかしながら、そうしたモデルの開発や、モデルの業務への展開において時間をロスするようであれば、結局はビジネス価値も大きく損なってしまう。

モデル開発や展開における時間ロスは、ビジネス価値のロスに直結すると北川氏は指摘した

 そこで、SASでは機械学習の「アルゴリズム」と「自動化」の2点を重要視し、顧客にとって使いやすく、なおかつ精度の高い予測分析ソリューションを提供している。

 「SASでは、これまであまり『機械学習』テクノロジーを前面に訴求してこなかったが、実はさまざまな製品で機械学習を取り入れている。今回の発表で、それをさらに拡張できた」(北川氏)

■関連サイト

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ