このページの本文へ

前へ 1 2 3 4 次へ

さくらの熱量チャレンジ ― 第26回

ソフト/アルゴリズム/ハードへの深い理解に基づく深層学習モデル最適化技術、その裏側を聞く

安価な組み込みAIを世界へ! Ideinが「高火力」を選んだ理由

2018年09月05日 11時30分更新

文● 大塚昭彦/TECH.ASCII.jp 写真● 曽根田元

  • この記事をはてなブックマークに追加
  • 本文印刷

 さくらインターネットは2018年7月30日、高火力コンピューティングのGPUサーバー新モデルとなる「Tesla V100(32GB)モデル」の提供を開始した。それと同時に、昨年から提供してきた「Tesla V100(16GB)モデル」の価格改定も行っている。こうした動きは、“熱量”を持ってディープラーニング(深層学習)技術の研究に取り組む企業や研究者を後押しするためのものだ。

 今回はディープラーニング領域でさくらの高火力コンピューティングを利用しているIdein(イデイン)代表の中村晃一氏に、アスキー編集部 大塚とさくらインターネットの江草陽太氏、長谷川猛氏が、Ideinが持つ技術の特長や独自性、将来の可能性、さらに高火力コンピューティングに対する評価や新しい32GBモデルへの期待などをうかがった。(インタビュアー:アスキー編集部 大塚、以下敬称略)

さくらインターネット 技術本部 高火力チームの長谷川猛氏、さくらインターネット 執行役員 技術本部副本部長の江草陽太氏、Idein 代表取締役の中村晃一氏

安価な組み込みデバイスで精度の高いディープラーニングモデルを動かす

――まずはIdeinの事業領域や技術的な強みについて、簡単にご紹介いただけますか。

中村:Ideinは、ディープラーニング技術を安価なデバイスで使えるようにすることで、世界中に普及させることに取り組んでいるベンチャー企業です。画像認識や音声認識の処理を、従来の100分の1、1000分の1という価格帯のデバイスで、従来と変わらない精度、遜色のないスピードで実現するための技術を開発しています。

 また、今年2月には大手自動車部品メーカーであるアイシン精機さんとの資本業務提携契約も締結し、自動車組み込み分野における研究開発も共同で行っています。

 実際にわれわれがどんな世界を目指しているのかは、デモを見ていただいたほうがわかりやすいと思いましたので、今日はいくつかのデモを用意しています。

Idein 中村氏。手にしているのはRaspberry Pi Zeroに画像認識モデルを組み込んだデバイス

中村:まず1つめのデモは、600円くらいで買える「Raspberry Pi Zero」を使います。裏面にカメラモジュールを取り付けており、このカメラが捉えたモノが何なのかをリアルタイムに分類し、テキストで表示するというものです。画像認識処理ですね。

 たとえば、このカメラでPCを写すと……「computer keyboard」と表示されました。会議室の窓に向けてみると「windows screen」や「windows shade」と認識していますね。Web検索したパンダの画面を写すと「giant panda」と出ます。現在のバージョンでは、これを平均96ミリ秒で処理できています。

Raspberry Pi Zeroのカメラが写したものを瞬時に画像認識する。この写真はPC画面上のパンダを写したときの結果

――およそ0.1秒、一瞬ですね。これは画像をクラウドに送って処理してるんですか?

中村:いいえ、すべてRaspberry Piのオンボードで動いていて、外部とは一切通信していません。この深層学習モデル自体はグーグルがWebで公開しているもの(MobileNet)ですが、それをIdeinの技術で最適化することで、リソースの少ないデバイスでもこのスピードで動かせるんです。

江草:完全にスタンドアロンで動いているんですね。すごい。

中村:Ideinの技術のポイントは「スピード」なんです。

 グーグルが作ったこの画像認識モデル自体は、もともとはスマートフォンなどのハイスペックなデバイスで動かすことを想定したものです。そのままRaspberry Piに載せても重くてまともには動きません。しかし、それをわれわれの技術で最適化すれば、十分実用的なスピードで動かせるようになるわけです。

Ideinが公開しているデモビデオ(YouTubeより)。Raspberry Piを使い画像認識/顔検出/姿勢推定の処理を行っている

中村:次のデモは、今お見せしたデバイスに「sakura.io」の通信モジュールを組み合わせたものです。こちらも同じくカメラ画像を分類するモデルが載っており、認識結果の情報だけをLTE網で送信しています。

長谷川:こちらも速いですね。カメラを向けると、PC側で瞬時に「water bottle」とか「coffee mug」とか表示されます。

sakura.ioの通信モジュールを組み込み、画像認識結果だけをLTE網で送信するデバイス

中村:sakura.ioの帯域幅ではカメラ画像そのものは伝送できませんが、認識した結果だけ、具体的にはそのモノが何かを表すID番号だけであれば十分に流せます。画像認識の処理がエッジデバイス(Raspberry Pi Zero)上で完結しているからこそ、このようなデモも可能になるわけです。

 こんなふうにエッジデバイス側で高度な解析ができれば、フィールドにたくさんデバイスをばらまいてデータを収集したいときに役立ちますよね。sakura.ioのような安い回線を使ってデータ収集ができますから。

 最後にもうひとつ、こちらは4000円ほどで買える「Raspberry Pi 3」です。このデバイス上で、カメラに写った人間の骨格や顔の向きを認識するモデル(姿勢推定モデル)を動かしています。

江草:これも十分なスピードで動きますねえ。面白いです。

中村:こちらも、従来の技術だとだいたい数十万円するコンピューターを使わなければ実現できませんでした。そうしたディープラーニング技術を数千円、数百円のデバイスで実用化し、利用の普及を促すというのがIdeinの取り組んでいることです。

Raspberry Pi 3に姿勢推定の深層学習モデルを組み込んだデバイスのデモ

前へ 1 2 3 4 次へ

この連載の記事

灯油タンクで残量検知を実現!北海道の生活を守るIoTとは【熱量IoT】#3

動画一覧はこちら!