Gemini搭載スマートグラスのプロトタイプを体験した
基調講演での発表を踏まえ、展示会場ではAndroid XRプラットフォームをベースとしたスマートグラスのプロトタイプを実際に試す機会がありました。
今回用意されていたプロトタイプは、今後の製品化に向けた技術実証機としての側面が強く、デザインや仕様は開発途中段階のものでした。オーディオグラスの基本構成をベースにしていましたが、右側のレンズには透過型のOLEDを搭載するディスプレイグラスでもありました。カメラとマイクも内蔵されています。筆者も実機を現地で体験しました。
最初のデモンストレーションでは、Geminiが内蔵カメラを通じてユーザーの視界を共有し、目の前にあるオブジェクトについて説明する機能を体験しました。テーブルの上に置かれたゲームボードを見つめながら、「これは何のゲームですか?」と音声で問いかけると、デバイスが即座に視界にあるオブジェクトをカメラで取り込み、画像情報を解析し、それが囲碁であることを的確に回答しました。
回答は音声と、ディスプレイにカラーでもテキストやアイコンも表示されます。カメラが捉えた映像をAIがリアルタイムで解釈し、ユーザーの疑問に対して適切な情報を提供する仕組みが、大きく遅延することなく機能していることが確認できました。
続いて、視界に入ったアイテムをショッピングリストに追加する操作を体験しました。特定の物品を見ながら「これを買い物リストに追加して」と指示を出すだけで、システムが対象を認識し、連携しているリストのアプリケーションに自動的に登録処理を行ないます。
手が塞がっている状態や、移動中であっても視線と音声のみで日常の記録タスクを処理できる仕組みは、日常生活の中で便利に感じられると思います。
エリック・クラプトンの名前が書かれたポスターをみつめながら、Geminiに「このアーティストの楽曲を再生して」とお願いすると、ペアリングしたスマホが音楽サービスを選択。クラプトンの楽曲がスマートグラスのスピーカーから聞こえてきました
さらに、生成AIを活用したクリエイティブな機能のデモも行なわれました。撮影ブースに立ち、グラスに向かって「私の写真を撮って、背景を東京の景色にして」と音声で指示を出すと、撮影した写真データに対して、バックグラウンドのGeminiが指示通りの画像編集を実行します。データはスマホの「フォト」アプリに保存されます。
レスポンスは良好。「声による操作」には課題も残る
今回のプロトタイプにおけるデバイスとの対話は、スマートグラスのタッチセンサーやボタン操作でGeminiを呼び出すアクション以外は、基本的にすべて音声入力によって行ないました。物理的な操作を極力減らし、AIとの対話を通じてタスクを遂行するユーザーインターフェースはグーグルらしいと感じます。
一方で、日本国内では電車やカフェの中で「声による操作」は困難です。ペアリングしたスマホを使えば各機能は利用できますが、Fitbit Airのようなリストバンド型デバイスをペアリングして、リモコンの代わりとしても活用する等の「オプション」を設ける必要があると思いました。
2026年秋に登場予定のオーディオグラスは、アイウェアとしての洗練されたデザインを保ちながら、Geminiによる高度な音声アシスタント機能を日常に持ち込むデバイスとなります。また、プロトタイプで体験したユースケースは、今後に続くスマートグラスが提供する視覚と聴覚による新しい体験の基盤になるものです。
いつもスマホの画面に視線を落とすことなく、顔を上げて周囲の環境と関わりながら、スマートグラスを活用できる環境が一気に拡大するのでしょうか。今秋の商品登場が楽しみです。

筆者紹介――山本 敦
オーディオ・ビジュアル専門誌のWeb編集・記者職を経てフリーに。取材対象はITからオーディオ・ビジュアルまで、スマート・エレクトロニクスに精通する。ヘッドホン、イヤホンは毎年300機を超える新製品を体験する。国内外のスタートアップによる製品、サービスの取材、インタビューなども数多く手がける。
本記事はアフィリエイトプログラムによる収益を得ている場合があります










