では、現状の音声アクセスはどんなものか
現状では、音声アクセスは英語のみの対応であるが、その設定ページなどがすでに用意され、ヘルプページなども存在することから、いずれは他の言語に展開する予定はあるのだと考えられる。言語対応は、通常は認識エンジンや学習済みニューラルネットワークの問題であり、言語処理の簡単な英語からというのは理解できなくもない。
音声アクセスとWSRは、ボイスに関する同じような処理に対応するが、わかりやすい違いとしては、Voice Commandの改良がある。WSRでもキーの名前を発音して打鍵させることは可能だったが、音声アクセスでは、タッチキーボード自体の操作をキートップ文字とは別に表示される数値で指定して打鍵させる方法が利用できる。
![Windowsにおける音声認識など、ボイス機能を整理](/img/2023/10/07/3618269/l/756a7f91c096f674.png)
Windows音声アクセスでは、画面上部にステータスバーが表示される。「Show keyboard」でタッチキーボードを表示させ、キーに対応した数字を発音することでキー入力も可能になった。複雑なつづりやキーボードによるアプリケーション操作も音声からできる
WSRには「マウスグリッド」と呼ばれるマウスによる選択をボイスで行う機能がある。画面上を9つの領域に分割し、グリッド番号を連続して発音することでマウスポインタの位置を指定する。これに対して音声アクセスにも同様の機能「Show Grid」があるが、こちらはグリッドの数字を選択すると該当範囲のみ表示され、必ずしも連続して番号を言わなくてもよくなった。
![Windowsにおける音声認識など、ボイス機能を整理](/img/2023/10/07/3618270/l/67cda85464a45311.png)
WSRでは、「マウスグリッド」と話して、画面全体を9つに分割していくグリッド指定でマウス位置やオブジェクトの選択が可能だ。同様の機能は、音声アクセスにもあり「Show Grid」と話すと同様にグリッドを表示するが、改良されていて、連続してグリッド番号を話さなくてもよくなった
音声アクセスは、Windows 11 Ver.23H2からログイン前の段階から利用できるようになった。WSRはログイン後でなければ不可能だった。
Windowsのボイス機能は、AI機能の導入などもあり、節目に来ているようだ。たとえばプレビュー中のCopilotを使うと、「集中モードをオンにする」といった入力(もちろん音声でも行える)は、質問ではなく作業の指定と受け取られ、「フォーカスセッションを設定する」という確認が表示される。作業を直接音声で指定できなら、GUI操作を音声で細かく指示する必要はない。
![](/img/blank.gif)
この連載の記事
-
第436回
PC
Copilot+PCとともにWindowsのデバイス間連携に大きな変化!? Project ROMEの逆襲? -
第435回
PC
Windows Terminal Preview v1.21では、前回終了時のタブとその表示内容を復元できるように -
第434回
PC
AIの急速な導入がWindowsの予定を変えた!? Windows 12がすぐには出ない可能性 -
第433回
PC
Windows 11の2つのウィジェットを調べる -
第432回
PC
ウェブブラウザが切り開いたWindowsでのタブアプリケーション -
第431回
PC
Windows上でユニコードを「見る」方法 -
第430回
PC
WindowsからWordPadが廃止! RTF(Rich Text Format)はどうなる? -
第429回
PC
Windows Updateの「利用可能になったらすぐに最新の更新プログラムを入手する」はオンにした方がいいか? -
第428回
PC
Google/Bingで使える検索オプション -
第427回
PC
WindowsのPowerShellのプロファイルを設定する -
第426回
PC
WindowsでAndroidスマホをWebカメラにする機能を試した - この連載の一覧へ