このページの本文へ

さくらの熱量チャレンジ 第7回

計算資源があるからアルゴリズムやプログラミングに注力できる

機械学習の成果を「高火力」で生み出すPreferred Networks

2016年11月02日 07時00分更新

文● 大谷イビサ/TECH.ASCII.jp 写真●曽根田元

sponsored

  • この記事をはてなブックマークに追加
  • 本文印刷

機械学習のプロ集団と言われ、国内製造業メーカーから熱い注目を受けるPreferred Networks(以下、PFN)。PFN エンジニアである渡部創史さんに、機械学習への取り組みや研究や製品開発に寄与する高火力コンピューティングについて聞いた。

機械学習のプロ集団は最新技術の掛け合わせが得意

 PFNの母体でもあるPreferred Infrastructure(以下、PFI)は2006年に設立されたエンジニア集団。プログラミングコンテストの世界大会参加者や機械学習のアルゴリズムに強いメンバーが集まって設立されたが、当時は人工知能や機械学習への認知度が低かった。「当時、アルゴリズムの技術を実ビジネスに活かそうと思ったら、検索が有望だと考えられた。そのため、テキスト検索エンジンの会社として立ち上げた経緯があると聞いている」とPFN エンジニアの渡部創史さんは語る。

 しかし、機械学習の市場が立ち上がりつつあり、2012年頃に画像認識などでディープラーニングが圧倒的な精度を実現するようになってきた。こうした経緯を受け、ディープラーニングの会社としてPFIからスピンオフしたのがPFN。NTTのほか、FANUC、トヨタ自動車などから出資を受け、IoTや機械学習を活かした分散協調型のコンピューティングを推進している。渡部さん「人工知能というとあいまいなので、今まではわれわれもあまり使わないようにしていたのですが、去年くらいからあきらめました(笑)。機械学習というと理解してもらうのが大変なのですが、人工知能というとバズったのもあって、良くも悪くもクライアントがイメージしやすいんです」と語る。

 PFNは「Googleと御せる機械学習の専門家集団」とも言われ、エッジヘビーコンピューティングのようなキーワードでも語られるが、実際は複数の最新技術を掛け合わせられるところが強みだという。「アルゴリズムやディープラーニングの最先端をキャッチアップし、アドバンスなものを作れるスキル、プログラミング能力の高さ、フットワークの軽さなどが評価されると思います」(渡部さん)。実際、機械学習の分野で論文を書ける研究者は多くいるが、エンタープライズで導入効果を得られる事業に仕上げるところまでは長い時間がかかる。こうした中、少ない人数でスピード感を持って効果を上げられる体制が整っているのが、PFNの大きな強みだという。

日本の製造業の強みを機械学習で最大化したい

 現在、同社は独自の機械学習フレームワーク「Chainer」を中心にした技術開発をビジネスとして展開している。「受託開発ではなく、弊社に技術を蓄積していって、うまく行ったら他社にライセンシングしたり、協業している会社のビジネスにつなげていこうとしている」と渡部さんは語る。

 実際、PFNがどのようにプロジェクトを進めているか、イメージできるように流れを整理してもらった。人工知能は使った案件は大きく2つに別れるという。1つは経営サイドから人工知能を使うよう現場部門にオーダーが降りるトップダウン型、もう1つは現場部門が人工知能でピンポイントで課題を解決するというパターン。このうちPFNは経営層に近いところから話を進めて、そもそも機械学習で解決すべき課題なのかをきちんと顧客と詰めることが多いという。「機械学習ではなく、ルールベースやプログラムを使えば済むのではないか、苦労して作ってコスト対効果にきちんと見合うのかなど、技術的・ビジネス的にやるべきかどうかを整理します。研究費も直近の予算より、2~3年後にどのようなビジネスを共同でできるかを相談させていただき、それが合致するようであれば、弊社でプロジェクトが立ち上がります」(渡部さん)。

 得意なメンバーが集まってプロジェクトが立ち上がると、顧客からデータをもらって、研究開発・PoCのフェーズに進む。PoCの結果、成果物ができたら、これらを顧客とPFNがプロダクトやサービスとして提供。最終的にはPFNにはライセンス料などでリターンが入るというビジネスモデルを目指している。

 現状、PFNは自動運転などのトランスポーテーションのほか、製造業系のロボット、ゲノムなどを解析するバイオヘルスケアの3つの分野にフォーカスしている。こうしたなかChainerのような技術を独自で開発し、ハードウェアに組み込めるソースコードを持っているところは少ないため、製造業での注目度は特に高いという。「日本の製造業はまだまだ強みがある。これに弊社の技術が組み合わせて、競争力が高められると思います」(渡部さん)。

アルゴリズムやプログラミングの専門家にとってのGPUサーバー

 こんなPFNが高火力コンピューティングに行き着いたのは、2016年1月にさかのぼる。機械学習用のリソースをさくらインターネットから調達しているドワンゴからの紹介で、GPUを大量に調達できる事業者として、さくらに個別に相談が行ったのがきっかけだ。「研究の結果、GPUがかなりの数必要になるのがわかってきました。それをどのように工面するかは、悩みの種でした」と渡部さんは語る。両者の協議の結果、単なる顧客と事業者という関係を超えた協業が実現し、高火力コンピューティングのプレスリリースにはPFNがパートナーとして乗ることになった。

 高火力コンピューティングを担当するさくらインターネットの須藤武文さんは「国内で機械学習の会社といえば、まず一番にPFNさんの名前が上がる。世界的に名を知られているフレームワークを国内で作っている会社は他にない。そういった存在なので、さくらとしては協業という形で進めさせていただいている」と語る。PFNのChainerがさくらの高火力のインフラ上で動くことで、最大限の効果を引き出せる。これが協業のもっとも大きなポイントだという。

 「基本的にPFNは知識労働の会社なので、モノは持たない。GoogleやFacebookのように垂直統合ですべてを持つ会社もいますが、現時点でのPFNは外部のリソースを利用した方が得策と考えられたのはないかと思っています」(須藤さん)

 これに対して、渡部さんは「われわれはアルゴリズムやプログラミングが得意な集団なので、いいスペックのサーバーをデータセンターに持っていって、ケーブリングして、運用するなんてことは全然得意じゃない。どのようにCPU、GPU、サーバー、ネットワークを組み合わせれば最高のコストパフォーマンスが出せるのかまではみられない。こうしたことに関しては、知識のある専門家にお任せするというのは当初からの考え方です」と語る。

研究開発も、商用化も担えるインフラを高火力に期待

 PFNとさくらの話があった2016年1月から話はとんとん拍子に進み、4月には複数台のGPUサーバーがPFNで利用されるようになっている。提供されている高火力のリソースは製品開発・研究開発の両面で使われており、Chainerのプログラミングや機能強化にも貢献しているという。「高火力のリソースによって、メモリ不足で落ちていたソフトウェアがきちんと動くようになり、同僚からお礼を言われました(笑)」と渡部さんもうれしそうだ。

メモリ不足で落ちていたソフトウェアがきちんと動くようになり、同僚からお礼を言われました(笑)」(渡部さん)

 さくらとしては、機械学習の市場をPFNがきちんと切り開くことが、結果的にさくらのビジネスにつながっていくと考えている。須藤さんは、「そもそもたくさんの計算処理をしたいというユーザー層がいないと、高火力コンピューティングがサービスとして成り立たない。機械学習の市場を拡げていくためには、やや遠回りだけど、PFNのようなフロンティアにきちんと成果を上げてもらうほうがいい。PFNのようなところがリスクをとって機械学習の実績を社会的に上げてもらわないと、国内の多くの企業でなかなか意思決定に至らない」と語る。

 一方のPFNとしては、研究開発の次にある商用化を考えると、高火力コンピューティングのようなサービスは必須だと考えている。渡部さんは、「何千台、何万台のカメラの画像を処理するのであれば、PoCに比べて、サーバーの数が一桁多くなる。われわれもこうしたレベルを目指していかなければならないし、商用化の段階では高火力コンピューティングのようなサービスが必要になってくると思います」と語る。機械学習用のチップ自体を開発するGoogleの例を見るまでもなく、スピーディに動く機械学習の市場で生き残るためには、こうした計算資源は必須になるという。

 渡部さんは、「研究開発で使いたい新しいマシンも、商用化に向けて大規模化するのに必要なサーバーも、両方とも必要。欲を言えば、高火力にはその両方を担って欲しい」とさくらインターネットに高い期待を寄せる。

(提供:さくらインターネット)

カテゴリートップへ

この連載の記事

灯油タンクで残量検知を実現!北海道の生活を守るIoTとは【熱量IoT】#3

動画一覧はこちら!