開始当初は「冷蔵庫の材料でぱぱっと副菜を作れる」がコンセプトだった
クックパッドはAmazon Echoが日本に上陸したのと同時にサービスを開始し始めた。しかし、今の形とはずいぶん異なっており、当初は「使いたい食材を1~2つ伝えると、その食材だけでできるレシピが検索できる」ものだった。現在のスキルは汎用的に作られているが、当時は冷蔵庫にあまっている食材だけでぱぱっと作れる副菜を提案するのが価値だったわけだ。「当時は画面付きのEchoがなかったので、レシピをスマートフォンにプッシュ通知するというものでした」(山田さん)。
なぜこうしたサービスになったか。ここには個人で購入したEchoは家に置かれるため、クックパッドのスキルを使うタイミングは、「料理する直前」もしくは「料理の最中」という仮説があった。「レシピを検索した後に、買い物させるのは絶対に避けるべきで、パパッと一品作って、晩ご飯を増やすことがいいゴールだと考えていた」(山田さん)。
これを実現するために、まずモバイルアプリの代替は目指さないという目標が掲げられた。そもそもスマホとスマートスピーカーは異なるデバイスで、購入の動機も全然異なるし、前述した「全体のインタラクションが早くならない」という課題もある。また、一度に提供できる情報が少ないので、とにかくシンプルなレスポンスを心がけ、やりとりも極力減らすようにしたという。「読み上げる文章を短くするだけではなく、スマートスピーカーに向いてない機能は思い切って実装しないという選択になった。インタラクションを少なくし、とにかくゴールに早く近づけるように心がけた」(山田さん)。
とはいえ、これだけだと日常的に使ってもらうのは難しい。そもそも副菜を必要とする日が1週間のうちに何度あるのかという疑問もあるし、インタラクションが複雑になるようなメニューの搭載は避けたい。そのため、聞かれた内容によって提案のフローも変えた。たとえば食材1つの場合、すぐに作れる簡単な人気レシピを提案し、2~3品の場合はインスピレーションを得ることを目的にしていると想定し、幅広いレシピを用意することにした。さらに料理名を聞かれた場合は、単に作り方を忘れているという想定で、その料理で一番人気のレシピを提案するようにした。とにかくインタラクションを減らすことに労力を割いたわけだ。
「大根のレシピ」が「鯛とコーンのレシピ」になってしまった
開発に際しては、Alexaが認識する言葉を定義するモデルの調整に「本当に」苦労したという。膨大な食材に対して、幅広い単語、幅広い聞き方で、きちんと対応できるようにするため、試行錯誤を繰り返したが、誤認識に悩まされた。「たとえば、『大根のレシピを教えて』が『鯛とコーンのレシピを教えて』になってしまった。当時の僕にはどうしようもなかったので、鯛とコーンを認識できる語から消した」と振り返る。
しかも、こうした事象はシステムエラーではないのでなかなか気づけない。そのため、開発に際しては、ひたすらAlexaと対話を繰り返したという。「最初は小声でしたが、最近は大声で会話を繰り返しています。恥ずかしいですよね。僕のあだ名はAlexaになり、社内の飲み会で『Alexa、レモンサワー頼んで』と言われました(笑)。さすがに怒っていいやつだと思います」には、会場が爆笑のうずに包まれた。
昨年まではテスト環境もあまりよくなかったが、最近ではインテント(意図)やインタラクション(やりとり)単位のテストもできるようになってきた。「でも、あれはあくまでテキストベースのテスト。認識されさえすれば正しく動くわけではない。モデル調整の職人芸とAlexaとの会話が重要になってくると思います」(山田さん)。結果としては、同僚をAlexaに見立て、インタラクションをテスト。これなら確かに台所と同じ状況を作り出せる。
ここまで苦労して作った機能だが、最終的にはクローズした。画面付きスマートスピーカーが登場し、今までスマートスピーカーの弱点をスマホで補う必要がなくなったため、前向きに機能を閉じたという。「スマートスピーカーでスマホにレシピが送られるというスキルでしたが、やはり登場人物が2ついるスキルは難しいと感じました。今だと画面付きのスマートスピーカーが出てきたので、スマホを参加させる理由がなくなった」(山田さん)。
この結果、料理手順を音声で逐一指示してくれるという現在のスキルに落ち着いた。スマートスピーカーで料理を探すところから、作るところまですべて完結することができるようになったため、料理に集中できるようになった。使ってみた感想として、山田さんは「指でデバイスを汚してしまわないことより、どちらかというと目線を移す必要がないのがメリットだと感じた。あくまで音声のオプションとして画面を見ればよいので、調理への没入感があっていい体験になった」と語る。もちろん、声の届くところにデバイスを置けばいいので、キッチンで汚れないというメリットもある。
試行錯誤しながらPCやモバイルでは提供できない価値を探す
最後、山田さんは昨年発足したスマートキッチン事業部の活動を披露。「OiCY」というブランドでメーカーとの共同開発を進めている同社の調味料サーバーとAlexaスキルとの連携について説明した。
調味料サーバーは、しょうゆ、みりん、酒、お酢の4種類をボタンで調合してくれる調理器具。これとAlexaを連携すれば、音声で「大さじ一杯のしょうゆ」を出してくれるだけではなく、ボタンに依存せず、無限の種類の調味料を作ることが可能になる。山田さんは「将来的には、たとえば『Alexa、三杯酢作って』『Alexa、照り焼き用のタレ作って』というとちょうどいい分量を作ることができるはず。VUIの大きな可能性だと思うし、音声アシスタントとIoTの相性のよさを示す一例だと思います」(山田さん)。
まとめとして山田さんは「まだまだ未成熟なデバイスやプラットフォームで試行錯誤を繰り返しながら、PCやモバイルでは提供できない価値を模索していくのはめちゃくちゃ楽しい」とエンジニアらしくコメントし、いっしょに開発する仲間を募集して、終了。Alexa開発の苦労と楽しさをぎゅっと凝縮したセッションが参加者のやる気を一気に引き上げたのは間違いない。