楽天の手つかずのデータを支援する
──Rubyを使って何をするのかということを考えたときに、楽天には大量のデータがあるわけですよね。
森:楽天で3800万、グループ全体で4400万の会員がいます。
まつもと:その膨大なデータが、ほぼ手つかずの状態にありました。これをデータマイニングすると、いろいろなことが分かると思うのです。でも、既存(商用)のデータベースを導入して決まり切った解析をしても、狭い範囲のことしか分からない。もう少し、柔軟なデータマイニングをしたいという思いがあります。また、データマイニングの際、パフォーマンスよりもいかに簡単な手順で処理できるかが重要になり、加えて処理がすごく早くないにしても現実的な範囲内で処理が終わる速度ということもカギになるだろうと考えました。
そこで、データセンターがあり、マシンもたくさんあるという楽天の環境の中で、もし比較的簡単かつ簡潔な指示で柔軟なデータ処理ができるプラットフォームがあれば、手つかずのデータに対して支援できるのではないか? という結論になったのです。そこからさらにブレストをし、ストレージに対する支援と大量のデータをいかに高速に格納して取り出すかということ、分散される処理をどうやって記述するのかを考える段階に至りました。
fairyとROMAを互いに強く結合させて、1つにまとめるという手もありましたが、楽天はすでにほかの分散ファイルシステムなどを使っていたことから、システムで組みたいということもあるでしょうし、fairyとROMAをJavaなどのほかの言語から使いたいという要望も出てくることでしょう。そこで、少し冒険になりますが、それぞれを別プロジェクトとし、疎結合させたものとして作ることにしました。そこまできたのが、昨年の夏ですね。
森:それから1年、ようやくプロトタイプができ、実装段階に入りつつある段階です。
(次回は、6月21日のRuby会議で講演予定のROMAのコンセプトについて紹介)
- ■取材協力
楽天(株)
日本Ruby会議2008サイト
お詫びと訂正:上記の記事に間違いがありました。読者の皆さまならびに関係者の皆さまにご迷惑をおかけしたことをお詫びして訂正いたします。
「Enjoy Programing」→「Enjoy Programming」
この連載の記事
-
第68回
ビジネス
『オバマ現象のからくり』(田中慎一) -
第67回
ビジネス
AMN新社長“ブロガー”徳力氏に聞く -
第66回
ビジネス
「完璧な上司なんて、いませんよ」 -
第65回
ビジネス
フランソワ・デュボワ 『デュボワ思考法』 -
第62回
ビジネス
こんなに差が出た! 30代給料の現実 -
第59回
ビジネス
地下巨大施設! プロジェクトは成功した -
第56回
ビジネス
エンジニアの秘められた家族生活 -
第55回
ビジネス
IT業界で10年泥のように働いてませんよ -
第54回
ビジネス
カシオG'zOneのデザインが変わったワケ -
第52回
ビジネス
“変わり種商品”に隠れたビジネス戦略 -
第52回
ビジネス
日本の家電ベンチャー、異例の存在 - この連載の一覧へ