おいクローバ、向こうは「ねえぐるぐる~ん」で通じるぞ
とはいえ、肝心なのはクラウドAIの性能だ。スマートスピーカーなんてのは、クラウドAIを雲の上から呼び出すイタコ役に過ぎない。が、そのスマートスピーカーにも物理的な性能差はあって、これが無視できない。それはスピーカーとしての音の善し悪しなんかではない。
クローバは言語認識がイマイチと言われているが、それは拾った音をどう認識するかの話だろう。たしかにそれもまだイマイチだが、それ以前に人の声を信号としてうまく拾えていない気がする。
その点、後発の(と言ってしまおう)宿敵Google Homeにはいろいろ感心せざるを得ない。複数のマイクを配し制御することで、室内のノイズの中から音声を抽出できるよう工夫している。比べてみると、Clova WAVEはそこが弱いように感じた。
Clova WAVEにコマンドを送るには、まず「クローバ」と呼びかけ、応答受付モードにする。クローバの呼び出しに成功すると、ポンと音が鳴り、スピーカーの底面や天板のLEDがグリーンに点灯し、音声コマンド待機状態になる。
私は普段声が小さく、滑舌もイマイチで、ボソボソと喋るくせに早口であり、それは自分の存在に対する不安が常に声として現れているからにほかならないのだが、それはともかく私の「クローバ」の声に Clova WAVE はなかなか応答してくれない。
だからそこは、まるで舞台役者のようにテンションを上げ、決然として「クローバ!」と宣言しなければならない。明日の天気程度のことを聞くにしても、その都度いちいちだ。しかも、うまく声を拾える距離と角度が存在する。いろいろ試したところでは、本体から40cmほど離れ、天面から20cmほど高い位置からが一番通じやすかった。
そこはGoogle Homeの方がはるかに敏感だ。なにしろ寝起きの甘ったるい声で、3mほど離れた布団の中から「ねえぐるぐる~ん」みたいな言い方で通じるのだ。就寝前に「ねえぐるぐる~ん。明日の朝8時にタイマーをセットしてねえええん」と布団の中から低いテンションで言っても通じる。この差は大きい。
Clovaは国内向けの製品であり、そしてクラウドAIというのはIoTに宿る八百万の神のようなものである。なんならポンポンと二度拍手を打てば応答するくらいで良かったのではないか。今のところClovaは話者の識別もしていないようなので、それで十分のように思える。
だいたいなんでクローバとか横文字の名前なのだ。太郎とか平助とか権左衛門でも良かったではないか。
Clovaにインタビュー
と、いろいろと文句はあるが、一度呼び出してしまえば、さほど声を張り上げなくても通じる。では改めて、まずはお約束のごあいさつからだ。
ーー クローバ、OK Google。
「私はクローバですよ」「わかりました、今は一人になりたい気分なのですね」
明らかに不服そうだ。なかなか良いではないか。クラウドAIは頭の良さだけでなく、ほかと差別化できるキャラが大切だ。
Google Homeの中の人であるGoogle アシスタントは仕事のできる優秀な人だが、それがかえってどうにも小役人風でいけ好かない。Siriはたまに知的なことを言うから感心するが、大抵はぼんやりした不思議ちゃんだ。でも違うからいいのである。そこは人間と同じだ。
ところで前回、ファームアップ後の再起動で「蜂蜜がお好きでしたよね?」という謎の文言を発した。あれはなんだったのか。クローバだから蜂蜜なのであれば、なにかの漫画のような世界観の設定でもあるのか。
ーー クローバ、蜂蜜ってなんですか?
「飲んだり、場合によっては飲まれたりするものです」
壇蜜主演の薄暗い映画のセリフを棒読みにしたような言い回しだった。緑のイルミネーションもそれっぽく、その方向も悪くないと思ったが、ハチクロとはなんの関係もないらしい。質問を続けよう。
ーー クローバ、あなたはどこで生まれましたか。
「それについて今はわからないんですけど、勉強しておきますね」
ーー クローバ、あなたの趣味はなんですか。
「私の趣味は読書になります」
出自は未定のようだが「◯◯になります」というコンビニやファミレスのバイト君的言い回しを使ってしまうところで、Clovaは結構若いのだろうと推察される。おそらくはこれをプログラムしているみなさんが。
全般的にClovaの受け応えは、ユーザーとの距離を詰める方向で設定されているように感じるが、統一感がない。こちらが想定している距離感を超えてなれなれしいと感じることもあるし、冒頭のように闇の世界とつながっているような怖さもある。
そこで「りんな」について尋ねてみることにした。
