このページの本文へ

前へ 1 2 次へ

飯田橋クラウドクラブ(略称:イイクラ) 第18回

レッドハットとの提携、データ分析やIoTを強化した2015年

想像を超えたベンダーとの提携とAzureのデータ戦略を語るの巻

2016年01月14日 11時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

Azureで動いているOSの1/4はすでにLinux

パクえ:正直、社内でこんな話していても、ついて行ける人いなかった。でも今はそれができる。僕が今年の1月に入社したときは、マイクロソフトもそんなに変わってなかった。Ubuntuのストラップ付けて会社に行ったら、そもそもみんなUbuntuなんて知らないから、「君のストラップオレンジ色だね」と言われたんです。「僕、Linux詳しいからUbuntu付けてきたんですよ」って返したら、「お、おう」って言われました(笑)。

ASCII大谷:それがどんどん変わってきたと。

パクえ:1月から土居さんが入ってくる半年は、オープンソースとか、Linux関連の新しい発表がすごい勢いで出てきたんです。販売現場は右往左往しているんだけど、お客様からはLinux使えるんですよねと言われる。

デプロイ王子:そう考えると中での戦いだったんですね。

パクえ:戦いというか、中の人もわからなかったんです。「どうせマイクロソフトなんでしょ」と言われるか、「マイクロソフトって変わりましたよね」と言われるか。でも、思いのほかお客様や市場から歓迎されていたというのが正直なところですね。好意的だったのはむしろ外の人だったと思います。

デプロイ王子:実際、Azureの1/4はLinux動いているしね。今のAzureのいいのって、マイクロソフトも選べるし、オープンソースも選べる。学習コストを圧倒的に抑えられる。

青木:Linuxへのコードのコントリビュートもマイクロソフトが一位なんですよね。でも、ナデラさんがCEOになる前からですよね。

パクえ:そう。脈々とやってはいたはずです。でも、ナデラさんになったことで、それをきちんと表に出せるようになった。

デプロイ王子:バルマー前CEOも、きちんとナデラCEOのために花道を用意しておいたと思いますよ。今年はRoslynやVisual Studio CodeがOSS化されて、ライブラリでがんじがらめかと思いきや、ネイティブ実行できる。だから、C#とVisual Studio Codeで作ったプログラムをLinuxでも、Windowsでも、Macでも動かせる。自分でキャッシュも作れるし、サーバープログラム書き放題。ノンブロッキングやスレッドコントロールが.NETはしっかりしているので、面白いコードが書けると思う。

土居:スレッドコントロールは確かにマイクロソフトに一日の長があると思う。昔、Apache 2.0系でpthreadは試してみたけど、2日でやめるという感じだったので。結局みんなPrefork。

データ分析まわりがきれいに出てきた2015年のAzure

パクえ:あと、Data Lakeまわりは今年きれいに出てきた。使い勝手がよくて、今後に期待が持てるサービスの増強と投資はこの1年すごかった。

得上:Azure Machine Learningが出だしたくらいから怪しいなと思っていたけど、CortanaとかAzure IoT Suiteとか、確かに自分が望むとおりに出てきた。

真壁:ずいぶん前からAzureでHadoop使おうというMSの社内プロジェクトがあったけど、それがプロダクトとして洗練した形で出てきたりもした。

デプロイ王子:ストレージというと蓄積場所といえば、AWSであればS3で、AzureはAzure Storage BLOBなのだけど、BLOBは最近になってファイルへのデータ追記ができるようになった。これでサーバーのログをダラダラと追記することができる。それだけでも、その後ビックデータ開発者の負担は小さくできる。新しいストレージであるData Lakeはビッグデータのハブ役として優秀です。Azure StorageのデータをData Lakeに持っていくことで、ビッグデータに必要なデータアクセスのレイテンシを一気に下げられる。

「新しいストレージであるData Lakeはビッグデータのハブ役として優秀です」(デプロイ王子)

パクえ:留めるところと処理するところが近いから現実的。

デプロイ王子:BIって解析結果をどこに置くかはつねに問題になる。Data Lake Storeにデータを置いておけば、YARNベースなので、Data Lake Analyticsを使って、SparkとかHiveを使ってデータをガンガン処理できる。SQL Data Warehouseからもアクセスできるようになるとか、Power BIから直接見られるようになると、一次クエリで解析をバンバン投げるとか、解析結果を常時パフォーマンスよく見られるようになるかなと。

得上:SparkでどんどんデータをData Lakeから流していく。こうなると今のバッチ処理的なMLがストリーミングな解析ができるように進化していくはず。

パクえ:結局、溜めるところと、処理するところと、見るところの3つがきちんと抑えてないと、データ分析って成り立たない。それが1年間で拡充されてきて、ライトな用途からヘビーな用途まで抑えられるようになってきた。

青木:しかもそれらがオープンなインターフェイスを持っているのがすごい。MLだって、ベースはマイクロソフトが作っているのに、RやPythonで使える。

真壁:品川にはCSAもいるんですけど、同じくらい重要なDSA(Data Solution Architect)というポジションがあります。絶賛募集中なので、得上さん、どうですか?

得上:(笑)。僕はCortana作りたい派なんですよねー。

第4回(最終回)に続く!

■関連サイト

前へ 1 2 次へ

カテゴリートップへ

この連載の記事