12月18日、日本ヒューレット・パッカードはシングルサインオン製品「HP IceWall SSO(以下、IceWall SSO)」のアクセスログをリアルタイム分析するソリューションを発表した。IceWallに集まる認証やアクセスログを有効活用すべく、Verticaプラットフォームを組み合わせる。
情報が集まるSSOとビッグデータの関係とは?
IceWall SSOは複数のアプリケーションとのシングルサインオン(SSO)とアクセスコントロール(認証/認可/管理/監査証跡)などを可能にするSSOソリューション。エージェントを必要としないリバースプロキシ型ソリューションで、すでに4000万を超えるユーザーライセンスを誇るという。
今回発表されたのは、このIceWallとビッグデータ分析ソリューションである「HP Virtica Analystics」を組み合わせたWeb利用分析ソリューションになる。なぜSSOとビッグデータ分析なのか、日本ヒューレット・パッカードの小早川直樹氏が説明した。
イントラネット内の複数のアプリケーションの認証を統合する機能を提供してきたIceWall SSOだが、昨今はオンプレミスとクラウドをシームレスに扱えるようになり、モバイル端末からのリモート認証も増えてきた。この結果、IceWallにはユーザーの認証やアクセスのログが集まる“ハブ”になってきたという。「IceWall SSOには全アプリの利用情報が集中する。つまり、誰がなにをやっているか、社員のやっていることをを把握できる」(小早川氏)というわけだ。
しかし、IceWallのアクセスログが巨大化してしまうという課題がある。IceWallのアクセスログ自体が、既存のWebアクセスログより詳細であるのに加え、サインオン対象のアプリケーションが複数になると、容易にビッグデータ化してしまう。小早川氏は「企業でも多いところは1000アプリになるので、非常に大量のログがはき出される。多いところは数百億行に達する」と語る。当然、オフィスの始業時やオンラインバンクではアクセスが集中するので、ピークでは毎秒1万件くらいのアクセスに耐えなければならない。
こうした課題を解決するのが、高速なデータ分析を実現する「HP Vertica Analystic Platform(以下、Vertica)」になる。Verticaは検索に最適なカラム指向のRDBMSで、高度なデータ圧縮機能と並列アーキテクチャにより高い性能と検索性能を持つ。今回のソリューションでは、アクセスログを専用のETLツールで定期的にVerticaの分析サーバーに転送し、TableauのようなBIツールでリアルタイムに分析するというものだ。
作られ続けるIce Wallのアクセスログを高速にDWHにロードし、分析可能な状態にするという荒技だが、性能面での優位点を謳うVerticaだけに毎秒1万件でも問題なし。5年間のIceWallの全件分析の可視化やリアルタイム分析などのデモも行なわれ、数秒でデータのロードや分析画面が表示されていた。
ユーザーIDの取得でさまざまな分析が可能に
IceWallのアクセスログは、Webアクセスログのスーパーセットにあたり、通常のApacheと異なり、ユーザーIDが取得できる。そのため、ユーザーIDとプロファイル、購買履歴、受講履歴などをヒモづけることで、異なるユーザーグループごとにコンテンツのアクセス数を見るなど詳細な解析が可能になる。さらに異なるアプリケーションのログが、IceWallからすべて共通のフォーマットで出力されるため、一括・比較の分析が容易になるというメリットもある。
小早川氏は、実際にBIツールのTableauでどのような分析や可視化が可能かを説明した。たとえば、サーバーに対するレスポンスタイムを見ることで、遅延しているコンテンツや時刻をドリルダウンしたり、「深夜にアクセスしているのは誰か?」「中国の奥地からアクセスしているのは誰?」「本当にリソースを消費しているアプリはどれか?」などがダッシュボードで調べられる。導入に際しても、HP ProLiant DL380を3台追加すれば、共有ディスクは不要。チューニングもVertica側で自動的に行なうので、すぐに検索が始められるという。
小早川氏は、「社内で使われているのは、ほとんどメールかWebだ。メールは非構造化データ向けのAutonomyで分析していたが、今後はIceWallとVirticaの組み合わせで、Webアクセスも分析できる。企業の生産性向上やリスク管理に役立てることが可能だ」と語る。当初は既存のIce Wallのユーザーをターゲットしており、今後はより現場部門への導入も進めていくという。