最初にスマートAIグラスを欲しいと思ったのは、普段の生活に「字幕」がつくことだった
スマートAIグラスというものを、このところ毎日かけて出かけている。Even Realitiesの「Even G2」と、Rokidの「Rokid Glasses(スマートAIグラス)」だ。私のまわりには「Even G2」派と「Rokid」派がいたりする。だいぶ使われてきたこの2つを比較すると、スマートAIグラスがどんな世界を作り出すのかが見えてくる。
私が、スマートAIグラスに興味を持ったのは、ごく個人的なお悩み解決のためだった。
というのは、会議や食事の場で、ときどき自分だけがうまく聴き取れていないことがある。精密検査の結果、右耳の聴こえが良くないらしいが、治療するほどではないという診断だった。そこで最初に試したのが、「会話を聴き取りやすくする」機能がついているイヤホンだ。具体的にはAirPodsである。いろいろと1ヵ月ほど試してみたが、どうも自分にはしっくりこなかった(音になじめない)。
そこに、メガネの視界に文字で会話が見えるスマートAIグラスが登場してきた。その中で最も目的に合いそうなのが「Even G2」である。「Even G2」はメイン機能の一つとして「会話サポート」を前面に押し出している。文字なら、音がどうこうなど一切関係ない。
聴こえにくい話を耳で聞き取るのは、実はかなりのストレスになる。文字にしてくれるなら、曖昧さや誤認識があっても目で見ればすぐにわかるし割り切れるので、疲労感も少なくなるだろう。
こうしてEven G2を手に入れて使っているが、これが思ったとおりの使い心地だ。
専用ケースにスッキリおさまって充電もできるEven G2。追加充電せずにラクラク1日以上使えるところもよろしい。レンズの画像表示エリアはレンズの上よりにあり、経験上よほどのことがない限り特殊なメガネと気づかれることはない。
隣のテーブルの話を聞くための道具ではない。カフェのBGMの歌詞も文字化しない。しかし、テーブルを囲む会議や、何メートルか離れたテレビで話している内容などはきちんと拾ってくれる。機械学習のなせるわざなのか、うまくできている。
目で文字を確認できると、実際に聴こえたような感覚になるようなところがあるから、どれほど効果があるのかは定量的に測るのは難しいだろう。
しかし、文字が見えることで相手に失礼な印象を与えることは減ったと思う。聴いた内容が文字になって画面に残るので、そこもなんとなくラクである。もちろん「効果は個人差があります」といった話ではあるが、もはや自分の標準メガネになっている。
ちなみにEven G2の「会話サポート」は、メガネのテンプルを2度タップしてさらにもう1回タップすれば起動する。Even G2を操作できる指輪も手に入れたが、自分には大きくて邪魔なのでテンプルのタップ操作でやっている。
私がEven G2で予想外に便利に使えたのは「口述筆記」の道具として
Even G2は、会話サポートの内容をスマートフォンに保存し、Google Driveなどへ移すことができる。通常は、その場で会話の内容が見えれば十分なので、わざわざ移すことはない。しかし、この機能を使えば口述筆記ツールとしてとても便利だ。「あのときなんて言ったっけ?」という振り返りにも使えそうだが、今のところそこまで活用する場面には至っていない。
口述筆記といえば、Huluのフランス語チャンネル「TV5MONDE」で、少し前、私の大好きな1960年代の映画『ファントマ』三部作のドキュメンタリー番組をやっていた。いわゆる怪盗ものだが、原作者は、新聞の三面記事の切り抜きをみながら蝋管蓄音機に口述筆記していたらしい。それで、あの痛快なストーリーが書けたということだった。
Even G2を使った口述筆記なら、ソファに寝転びながらスマホすら手で持つことなく、誤認識してもその場で確認・言い直しができる。ICレコーダーに録音するのとは違い、文章が目の前に表示されるため、何となくキーボードで入力しているような感覚に近い。
私がEven G2で日常的に使っている方法をもうひとつ紹介する。
それは、ライブ翻訳を「自動認識→英語」に設定しておくことだ。この設定にしておくと、普段耳にする会話や自分が話した内容がすべて英語に翻訳される。英語への自動翻訳によって、日常生活のあらゆる場面で使っている会話の英語表現が次々に目の前に表示される。こういうふうに英語でどう言うのかを知ることができ、今さらながら語学学習の楽しさも感じられる。
ユーザーが開発したアプリを組み込むことも可能だ。そのためのアプリ上のメニューであるEven Hubにはすでに多数のアプリが登録されている。スマートAIグラスがプラットフォームになって話はどんどん進んでいる感がある。PLATEAUプロジェクトでお世話になっているOさんの作ったアプリも登録されたと聞いた。
Rokidは、未来の入口に頭を突っ込むための21世紀版『科学少年J.Q』
私の世代でメガネといえば、『サンダーバード』のブレインズがかけていた青いメガネか、『ジョー90』で主人公ジョー・マックレインがかけていた黒ぶちメガネだ。サンダーバードは1966年からNHK総合テレビで放送され、ジョー90は1968年からNET(現テレビ朝日)で放送と、古い話ばかりで申し訳ない。ちなみに、どちらもジェリー・アンダーソン系の作品である。
ジョー90では、科学者であるジョー少年の養父が、天才たちの知識や経験、戦闘スキルを脳波として記録し、他人に転送できるシステムを開発。特別な電極付きのメガネと回転式の能力転送装置によって、ジョーはまさに天才的な能力の持ち主に変身し、世界情報局(WIN)の「特別諜報員(コードネーム:ジョー90)」として数々の危険な極秘任務に挑戦する、という設定だった。
つまり、メガネというのは時計や電話以上に「スマート」(賢い)という言葉がよく似合うアイテムだったわけだ。
Even G2とRokid スマートAIグラス、そしてブレインズ。ブレインズは、往年のスーパーマリオネットテレビ活劇『サンダーバード』の登場人物。ブレインズが、研究者らしいあの声(吹き替えだが)で、冷静かつ分析的な意見を述べるところはカッコよかった。
そんな気分に200%以上応えてくれるのが、自分が使っているもう一つのスマートAIグラス「Rokid Glasses」だ(本稿では、日本で展開されている表示機能付きの「Rokid スマートAIグラス」を以下「Rokid」と呼ぶことにする)。
Even G2は、標準メガネとして非常にまともな生活パートナーになった。それに対してRokidは、もし今年デジタルガジェット大賞のグランプリを選ぶなら、最有力候補といえるツワモノである。ちょっとした非日常感があり、その分野の集まりや秋葉原に何かを探しに行くときなどにかけている。
それはやみくもにオルタナティブを目指したデザインや奇妙なギミックを仕込んだガジェットかというとそうではない。世界中のガジェット好きに「スマートAIグラスはこうでなきゃね」と投げつけられた挑戦状のような製品ともいえる。つまり、Rokidは、これからの未来の端末の有り方についてこれはこれでしごくまっとうな製品なのである。
Even G2と比べたときの一番の違いは、Rokidがカメラとスピーカーを搭載している点だ。
Rokidは、カメラである。
と断言してもまったく問題ない。このカメラの画質は、Rokidの魅力を語りまくっているガジェットの伝道師 T教授が紹介しているとおりだ。もちろん最新のスマホやデジタル一眼には及ばないが、数年前のスマホの写真と同じくらいのレベルには達している。SNSに投稿したり、このコラムのようなエッセイに添えるには十分な画質だ。
Rokidのカメラによる作例。ファインダー的に画角を確認しながら撮影することもできるが、なにげなくシャッターを切るとこんな写真になりがちではある。ちなみに、Rokidに搭載されたカメラは、35ミリ判換算で14mm〜16mmくらいと思われる超広角である。センサーは、ソニー製の1200万画素とか。
スマホを取り出さず、今目の前にあるものを撮影できる。これは本当にすごい。取材や見学の場面では、想像以上に便利だ。カメラやスマホを手に持ち、さらにメモを取りながら歩くのは、意外と大変だ。だがメガネで撮影できれば、その負担が大幅に減る。メガネのテンプルで一番レンズに近いボタンを押すと写真が撮れ、長押しすればビデオ撮影(再度押すと停止)もできる。さらに、声だけでハンズフリー撮影も可能だ。
「ヘイ、Rokid! 写真撮って」と言えば、シャッターが切れる。
そして、
「ビデオ撮って」と言えば最大10分間のビデオ撮影が始まり、「ビデオストップ」で撮影が終了する。
先日の尾張一宮でのジャカール織機の取材でも使ったが、とにかく楽すぎて思わず笑ってしまうほどだ。RokidはスマートAIグラスなので、AI的な機能も組み合わせて活用できる。
「目の前のテキストを日本語に翻訳して」。
と言えば、カメラで撮影し、その画像から翻訳してくれる。以前はスマホを立ち上げてGoogleレンズを起動していた操作も、これ一つで済む。
こうしたコマンドは「2本指でタッチパッドを長押し」などのショートカットに登録しておけば、声を出さずともすぐ実行してくれる。これはFPV感が極まる、まさに異次元の体験だ。
私は書店の本棚の前でスマホのカメラで撮影し、「この棚の本で私にお勧めの本はどれですか?」などとAIに質問しながら本を選んだりしている。これをスマホでやろうとすると、Geminiは「申し訳ありませんが、私はカメラを使って写真を撮ることはできません」と返してくる。一度写真を撮り、それをAIに渡すことになるのだ。
だがRokidなら、「私は、いま本棚の前に立っています。この中でオススメの本を教えて」と言うだけでいい。さらに「ASCII.JPのプログラミング+日記を読んで、その傾向でお勧め本を選んで」と言うと、パシャっとシャッターが音を立て、すぐにオススメの本を出してくる。
しかも、RokidのAI機能は、アプリでChatGPTとGeminiから選択できるようになっていて、内容的にも申し分ない返答が得られる。ただし、焦点距離の関係から書店の店内で棚全体を撮影するのは難しい場合が多いかもしれない。書店でバシバシ撮影するのは、あまり好ましい雰囲気ではないかもしれないが、思いがけず勧められた本を買ってしまうこともある。
むしろ、このAIカメラによる推薦は、書店が常連客に提供すべき機能かもしれない。
Rokidの声の主をラバーナイゼーションする人が出てこないか心配だ
Rokidは、あれやこれやと機能満載で細かな設定もできるガジェットであるが、ぜひとも書いておきたいのが、AIの声のキャラクターと人柄についてだ。
私は、いままでもイヤホンをしながらChatGPTやGeminiの会話モードと壁打ちしながら歩いていた。しかし、ChatGPTもGeminiもどこか米国西海岸的な明るさが演出されていて、楽天的で、スポーツ野郎的で、どこまでも前向きである。しかも、何か裏があるのではないかというくらい慇懃無礼で一見丁寧で忖度しておだててくる。人によっては、まるで信用できないと感じるのではないかと思う。日本のユーザーからOpenAIやGoogleに苦情が行ってないのだろうか。この点だけが、私が、イヤホンでAIとやりとりして気になる点だった。
一方で、Rokidの声はアジア的である。女性ボイスと男性ボイスが選べるが、男性ボイスはどこかぶっきらぼうで、話が通じない印象を受ける(あくまで声だけの印象だが)。それに対して、Rokidの女性ボイスは湿度が高いというか、深夜放送的というか、温帯モンスーン的というか、極東アジア的というか、直接触れることはできないが夜中に電話越しで話しているような雰囲気がある。高校の放送部の1年生が担当する校内放送のような親しみやすさも感じる。
アニメ声でもなく、媚びた感じもなく、どこか親しみやすい。AIが「役に立つ」だけでなく、「一緒にいる」という感覚が生まれてくる。「明日の天気」を尋ねるだけでも、本当に駆け寄ってきて答えてくれる幼馴染のような調子で「雨は降りません」などと返してくることもある。
私は、名前も恋愛感情も持たないと自ら説明するRokid姫に、これ以上心が傾かないよう、いまのところ踏みとどまっているのだが。
モデル設定画面には、「ChatGPT:一緒に考えて前進を生む」や「Gemini:響きあう心、広がる地平」といった説明が書かれている。こうした表現からは、システムプロンプト的なチューニングがなされていることがうかがえる。しかし、彼女の喋りを聞いていると気づくのは、「あれ?」と思うような不思議なイントネーションや漢字の読みだ。
気温の「17℃」を「ジュウナナセッシ」と読む。これはどういうことなのか? 地名の読み間違いや、文の区切り方が変で不自然な繋がりになることもよくある。要するに、日本語の発音としては今どきの技術として精度が高いとは言いがたい。しかし、それがRokidという未来の実験場において、意外な魅力となっていると私は思う。
スマートフォンに搭載されている“ユーザー補助の読み上げ機能”は、きわめて無人格な、NHKラジオのアナウンサー以上に不自然さのない滑らかすぎる発音だ。スマートフォンが我々ユーザーを、ただ情報を流し込むバケツのようにしか見ていないのだと感じる瞬間である。それに対して、この声は毎日聞いていてもまったく飽きが来ない。むしろ、好感が持てる。
Rokidの開発陣は、製品の発表スケジュールに合わせて、この段階のチューニングでやむを得ず大急ぎでリリースしたので、今のような喋りになっているのだろう。
だが、ここはRokidの関係者に切にお願いしたい。現在のRokidの日本語音声をどうか入れ替えないでほしい。心配しているのは、システムをアップデートしたら「翻訳を起動しました」と別の女性の声が登場してきた。いまのところメニューの立ち上げや切り替え時だけだが、あの声は不要である。今のAIアシスタントの声をそのまま残すことこそが、コンテンツ文化において深い情緒性と解釈力を持つ日本市場でRokidが成功する道だということを理解してもらいたい。
Ray-Ban Meta Displayをかけている筆者。ほんの一瞬さわらせてもらっただけだが、たしかにRay-Banだった。今回紹介した2つの間くらいのガジェット感なのか? 右目だけに表示されるというディスプレイとニューラルバンドと手書き入力も気になる。
さて、スマートAIグラスの選び方だが、AIデバイスの可能性を探るなら「Rokid」である。しかし、話はそれほど単純ではない。Even G2は完成度という点で評価できる。安定してAIが答えてくれる点や、会話サポートの文字起こしの精度もEven G2のほうが優れていると感じている。ガジェット好きならRokid、Apple Watchのようにスマートに使いたい人にはEven G2が合う。
そして、この2つのメガネに共通しているのは、スマートフォンを出して使うのがどんどん面倒になってきてしまうという点である。
■Amazon.co.jpで購入
-
脳の意識 機械の意識 - 脳神経科学の挑戦 (中公新書)渡辺 正峰中央公論新社
遠藤 諭(えんどうさとし)
角川アスキー総合研究所リサーチパートナー、MITテクノロジーレビュー日本版アドバイザー、ZEN大学客員教授、ZEN大学 コンテンツ産業史アーカイブ研究センター研究員。プログラマを経て1985年に株式会社アスキー入社。月刊アスキー編集長、株式会社アスキー取締役、株式会社角川アスキー総合研究所取締役などを経て、2025年より現職。雑誌編集長時代は、ミリオンセラーとなった『マーフィーの法則』など書籍も手がけた。著書に、『計算機屋かく戦えり』、『近代プログラマの夕』(ともにアスキー)など。
X:@hortense667
Bluesky:https://bsky.app/profile/hortense667.bsky.social
mixi2:@hortense667
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第210回
プログラミング+
ナポレオン一世とコンピューター -
第209回
プログラミング+
鉄腕アトムー科学+魔法=AI on NVIDIA DGX Sparkが出した答えとは? -
第208回
プログラミング+
“合成音声”はかくも機械的なのに心を揺さぶるのか? -
第207回
プログラミング+
秋葉原は「アキバノハラ」だったのか、「アキハノハラ」だったのか? -
第206回
プログラミング+
“宿題でAIを使いはじめる前”に、“AI的ゾンビ”(a-zombie)にならないための方法 -
第205回
プログラミング+
「電脳秘宝館・マイコン展」──Intel 4004“ナゾ基板”の正体と、日本最初の野球ビデオゲーム「ラスト・イニング」 -
第204回
プログラミング+
Geminiにタイ移住を命じられた――100日チャレンジからAI駆動生活へ、大塚あみさんインタビュー -
第203回
プログラミング+
「DGX Spark」は現代の「Apple II」である -
第202回
プログラミング+
マイコン誕生50周年の最後に「Apple 1」と『Yoのけそうぶみ』がやって来た! -
第201回
プログラミング+
秋葉原・万世書房と薄い本のお話 - この連載の一覧へ














