小さなお菓子メーカーに勤める新入社員の津井田くんは、社長の一声でBI導入検討を任されることに。お目付役の土須先輩とともに、BIの勉強を始めます。
今回は、オープンソースのBIソフト「Pentaho」に、実際にデータを入れてみます。
津井田 先輩、今日は実際にBIソフトを試してみましょう!
土須 ああ? だってお前、アレはエラく高いんじゃないのか?
津井田 いえ、今回使うソフトはオープンソースのもので、お金はかかりません。
土須 はぁ? カネがかからない? いったいITの世界ってのは、どーなってんだ?
津井田 いろんな考え方があるってことですよ。バブル世代はこれだから。クスッ。
土須 バカヤロウ! お前らはバブル世代をぬるま湯だ何だって言うけどな! ぬるま湯の中は芋洗い状態だったんだよ! 同世代人口が多かったからな。競争だってハンパじゃねーぞ!
津井田 世代論にこだわるのはジジィの証拠ですよ。“昭和くん”って言葉もあるらしいですね! プププ。あー、それから、お金がかからないといっても、もちろん構築してもらう場合には費用はかかるでしょう。今回は自分たちでダウンロードしてインストールするだけですからね。
土須 ケッまあいいや。とりあえず試してみるか。
津井田 今回は、BIって一体ナニができるのか、サンプルデータを元に操作できるので、自分たちの使いたいケースをイメージしながら試せるってワケです。ドリルダウンとか、「なるほど~」って感じですよ。インストールも簡単ですから、画面を見ながら勉強していきましょう!
オープンソースBIソフトウェア
Pentaho Open BI Suiteについて
前回までで一般的なBIの機能や導入手順を見てきた。今回からはオープンソースのBIソフトウェアを使って、実際にBIの機能を体験していきたい。
使用するのはPentaho Open BI Suite(http://www.pentaho.com)である。「Suite」の名の通り、レポーティング、分析、ダッシュボード、データマイニング、ETLなどBIに必要な機能が全て含まれている。
Pentahoは米ペンタホが開発するコマーシャル・オープンソースという形態のオープンソースソフトウェアである。一般的にコマーシャル・オープンソースとは、ソースは公開されているがソースの知的財産権は特定の企業が有しており有償であるというものである。Sugar CRMなどもこの形態をとっている。Pentahoは無償版(Community Edition)と有償版(Enterprise Edition)とに分けられている。両者の主な違いは使用できる機能、サポートの有無、ソフトウェアの保証となる。機能の違いは主には次のものである。
- 多機能なOLAPビューワーであるアナライザーレポートの有無
- エンドユーザーによるダッシュボード作成機能の有無
- 高度な管理機能の有無
前回までにご説明した一般的なBIの機能はすべてこのPentahoにも含まれている。今回はまずPentahoをインストールし、Pentahoに含まれるサンプルを使用することでPentahoの概要を把握していきたい。Pentahoでの実体験によってBIの機能やメリットへの理解が深まるだろう。
Pentahoをインストールする
前提の環境
- OS : Windows XP
- JDK : Sun Java 6
- Pentaho:Community Edition 3.5
Pentahoはプログラミング言語のJavaで実装されたソフトウェアである。そのため、Pentahoを動かすために実行環境としてJavaをインストールする必要がある。JDKについてはhttp://java.sun.com/javase/downloads/widget/jdk6.jspからダウンロードし、インストーラを使ってインストールする。
次にPentahoをインストールする。本連載で使用するソフトウェアは次のものとなる。各ソフトウェアの概要を述べるにとどめるが、詳細は各ツールを使用する個所で説明したい。
- Business Intelligence Server(BI Server)
- BIサーバー
- Data Integration
- ETL定義用ツール
- Schema Workbench
- OLAP定義用ツール
- Report Designer
- 定型レポート定義用ツール
- Metadata Editor
- メタデータ定義用ツール
- Design Studio
- アクションシーケンス定義用ツール
BI Server以外のソフトウェアはサーバーの各機能で使用する定義ファイルを作成するためのツールとなる。これらのツールを用いて作成した定義ファイルをBI Serverに配置し、BI Serverの機能でその定義を利用するのである。
今回はまずはBI Serverのインストールを行なう。BI Serverをhttp://sourceforge.net/projects/pentaho/からダウンロードする。
Pentahoのサンプルを動かす
Pentahoの起動
Pentahoの起動は、「biserver-ce」フォルダ内の「start-pentaho.bat」を実行するだけである。実行すると、Tomcatがポート8080で起動するため、他のアプリケーションでこのポートを使用していないことを確認してから実行する必要がある。
実行すると、「Tomcat」と「start_hypersonic.bat」という2つのコマンドプロンプトが立ち上がる。このうち「Tomcat」のコマンドプロンプトでエラーが表示されずに次の状態となれば正常に起動が完了している。
Pentahoへのログイン
起動が完了したらブラウザで次のURLに接続する。
http://localhost:8080/
正常に起動できていれば次の画面が表示されるはずだ。
早速ログインしてみよう。「Pentaho User Console Login」ボタンをクリックすると、ログインダイアログが表示される。
プルダウン「サンプルユーザー」で「Joe (admin)」を選択すると、ユーザー名とパスワード(ユーザーjoeのパスワードは「password」)が設定される。
そのまま「ログイン」ボタンをクリックすると、ログインできる。
ログインが成功すると次の画面が表示される。
画面は上部にメニューとアイコンが表示されている。アイコン列の右隅には、トグルブラウザーの表示/非表示を切り替えられるアイコンがある。トグルブラウザーを表示すると、画面が左右に分割される。左側がトグルブラウザーの領域で、ここで選択したファイルが右側に表示される。
Pentahoには、サンプルデータが含まれている。このサンプルは「スティールホイールズ」という仮想の会社のサンプルデータで、この会社を分析するという想定で各種機能を使うことができるようになっている。では、このサンプルデータを用いてPentahoの機能を実際に使っていきたい。
なお、Pentahoに付属しているサンプルデータは英語データのみであり、データの内容にはわかりにくい部分もあるかもしれないが、Pentahoの機能でできることの理解に重点を置いて読んでいただきたい。
次ページに続く
この連載の記事
-
最終回
ソフトウェア・仮想化
インタラクティブなBIダッシュボードを自分で作る -
第6回
ソフトウェア・仮想化
ついにBIのレポートを作成!どんどん実践的に使おう -
第5回
ソフトウェア・仮想化
いよいよキューブを作ってWebブラウザから閲覧開始! -
第4回
ソフトウェア・仮想化
DWHを自分で作ろう!環境構築からデータ登録まで -
第2回
ソフトウェア・仮想化
「BIの中身を覗きましょう」― BIの機能と導入手順 -
第1回
ソフトウェア・仮想化
「先輩、BIって知ってますか?」― 知識ゼロから学ぶBI -
ソフトウェア・仮想化
BIとは? 基礎からわかる最新BI事情 - この連載の一覧へ