このページの本文へ

大谷イビサのクラウドコミュニティな日々 第15回

音声認識に懐疑的だった記者がAlexa Dayへ至るまで

火種は2年前からまかれていた!今こそAlexaという名の熱狂を振り返る

2018年02月20日 09時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • お気に入り
  • 本文印刷

 神戸で開催されたAlexa Day 2018がすごかった。その熱狂の発端となったのは、多くの開発者に未来を見せてくれた2年前のAWS Summitの講演だろう。音声UIに懐疑的だった記者がAlexaコミュニティに飛び込み、Alexa Dayに至るまでの道のりを今こそ振り返る。

実はAlexa Dayの1週間前に我が家に到着したEcho Dot

1990年代のIT記者は音声認識に懐疑的だった

 オオタニがAlexaに最初に触れたのは、日本での提供なんてまったく決まってなかった2016年6月のAWS Summit 2016。当時AWSだった小島英揮さんから「絶対に聴け!」くらいの勢いで勧められたのが、アミット・ジョトワニ氏のAmazon Echo&Alexaのセッションだった。

 とはいえ、音声認識に関しては、長らく懐疑的だった。1990年代からIT業界に携わる記者にとって、音声(と翻訳)はなんだか超えられない壁だと思っていた。多くのベンダーがチャレンジしてきたが、正直言ってまともなプロダクトを見たことがない。非常に限定的な条件でたまたま成功するようなテクノロジーに、未来を見ることはできなかった。

 そんなベテラン記者にとって、音声で命令するスピーカーなんて、また黒歴史が増えるのかくらいにしか思えなかった。しかも、まだ英語しかお話しできないという。「そんなセッションに人が来るのかなあ」と、こっそり思っていた。

 しかし、広いAWS Summitの会場は満員。内容は記事を読んでいただくとして、ジョトワニ氏の話で鮮烈だったのは、なにより「Amazonは音声こそが将来と信じている」と言い切ったところだ。「期待している」とか、「がんばりたい」というレベルではなく、「次に音声が来る」と確信していた。しかも、自ら主体的にそのビッグウェイブを作り出すべく、開発者のエコシステムをきちんと作り上げていく意図が読み取れた。ライブコーディングでスキルを作ったのを見たとき、多くの開発者はAlexaや音声UIの未来が見えたのではないだろうか? 私もほかの記者より早くAlexaのインパクトに気がつくことができたのだ。

神戸の勉強会に参加し、Echo Dotを手に入れ、手放した

 その後、JAWS-UG神戸のAlexa勉強会にも参加してみたが、正直言って内容は難しかった。自分が書いた記事のなかで、かなりテクニカルな部類に入ると思う。音声を受け取って、言語を分析し、そこにこめられた意図を読み取り、不自然じゃない音声を時間内に返す。普段、人間が当たり前のようにやっていることをコンピューターとネットワークで実現することの壁の高さに頭がクラクラした。

 でも、JAWS-UG神戸の連中はニコニコしながら、「オレの英語を聞き取ってくれない!」「発音がビミョーじゃね」とその苦労を語るのだ。しかも、日本語が使えないので、すぐにビジネスにつながるわけでもない。「お前ら、どんだけドMだよw」と思ったが、そんなエンジニアたちに周りを囲まれると、この苦労が笑えてくる。そして、このダンスは自分も踊らないと損じゃないか?という気分になる。なんだか麻痺してくるのだ。そして、去年の5月にはJAWS-UGの多くの支部がオンラインで参加するAlexa Daysが初めて開催された。難しかったが、すでに神戸で勉強しているので、それほど悩まずに書けた。

 Alexaの日本語対応はなかなか発表されなかったが、2016年末に参加したAWS re:Invent 2016でEcho Dotがお土産としてもらえた。開発者イベントの次に放った火種である。もちろん、英語しかサポートしていなかったし、技適の問題もあったので長らく使うことはできなかったが、子どもたちが英語で必死に話しかけている姿を見て、あっさり未来が見えた。日本語で使えたら、どんなに楽しいだろうと思った。

 ちなみにEcho Dotに関しては後日談があり、京都の開発者イベントでAlexaもどきを作りたいとLTしていたエンジニアにあげてしまった。周りの人がIoTの可能性に気づかないことに対し、歯がゆい思いをしていた製造業女子だったが、あのEcho Dotが1つのタネとなって、楽しいAlexaライフを送ってくれていればよいなと思う。

床をぶち抜き、地雷を踏み続けるエンジニアのために

 2017年末、いよいよAlexaが日本語対応を発表し、Amazon Echoの販売も開始された。オープン時には各社がスキルを発表し、アスキーとしてもデジタルキューブの協力の下、こっそりJAWS-UG on ASCIIのフラッシュブリーフィングスキルを提供させてもらった。レスポンスが悪かったり、社内調整で軽くもめたり(笑)、なにより実物で試せないなど、いろいろご迷惑をおかけしたが、いの一番に提供できて、デジタルキューブの面々には本当に感謝している。

 そして、今回のAlexa Dayも日本語対応よりはるかに前からスケジュールをロックしておいてほしいと頼まれた。イベント当日、会場に足を運んでみて、記事で書いた通り「この熱狂こそ本当にニュースだ」と心底感じた。パルコやみずほ銀行のような大手も含め、多くの開発者たちが日本語対応のはるか以前から繰り返してきた試行錯誤をあまねく共有する。これこそコミュニティイベントの真骨頂だ。最終セッションでは、小島英揮さん、cloudpackの後藤和貴さん、サーバーワークスの大石良さんを迎えたパネルディスカッションにもモデレーターとして登壇でき、「このビッグウェイブを逃すな!」くらい偉そうなことを言ってきた。

 まだ記事は2本だが、音声認識にあれだけ懐疑的だった私がAlexa Dayを取材したら、あんなにポジティブな記事は書けなかっただろう。未来のために苦労をいとわない、試行錯誤をチャレンジとして楽しむ開発者の気持ちは理解できなかっただろう。これからも床をぶち抜き、地雷を踏み続けるエンジニアのために、記事を書き続けていこうと思う。

■関連サイト

カテゴリートップへ

この連載の記事