このページの本文へ

VAIO Z購入記、買ったからには徹底的に使いこなしてレビューする 第11回

VAIO Z上で再生した音声をそのままテキスト化する方法も紹介!

VAIO Zで音声をテキスト化するベストな方法

2022年03月22日 10時00分更新

文● 飯島範久 編集●ASCII.jp編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

 どうするのが最適解なのか、ずっと悩んでいることがある。インタビューなどで録音した音声データを自動的にテキスト化してくれるものはないものかと。

 これは、ライター特有の悩みなのかもしれないが、音声からのテキスト化というのは、会議の議事録でもやるような作業。効率よく、かつ正確にテキスト化してくれるソフトやサービスはないものかとずっと探している。

 最近は有料のサービスもあるが、ぶっちゃけそんなにお金はかけたくない。なのでお金をかけずになんとかできないものかと、これまでいろいろとトライしてきた。そこで今回は、音声認識率はまだまだなところはあるものの、筆者が現在活用している方法を紹介していきたい。

「Alexa」って意外と音声認識は高いと思うけど……。

 音声認識の世界では、英語だとかなり認識率が高くなってきているものの、日本語となるとなかなか難しいようだ。同音異義語などが多いし、かな漢字だけでなくカタカナ語、英語なども混じってくるため、誤変換が多い。

 「OK Google」や「Alexa」など、音声認識を利用して操作するような機器の場合、筆者の印象としては、かなり認識率が高い。Amazon Echoで家電コントロールなどをしているが、結構離れた場所から話しかけても認識してくれたり、「エアコンを切って」「エアコンを止めて」と表現を変えてもきちんと認識してくれる。

 この調子で、インタビューなども音声認識して、テキスト化してくれるとありがたいのだが、そうは問屋が卸さない。数年前からホントいろいろと試してきた。

 最初はGoogleの音声入力だ。iPhoneで「Google Keep」を起動して音声入力を使ってみたのだが、近距離にいてもなかなか音声自体を認識してくれない。一方、iPhoneの音声入力を使ったところ、音声自体は認識してくれ、そこそこの認識率ではあるものの、一定時間で止まってしまうため、インタビューにはあまり向かない。自分の声で原稿を書くというときにはいいだろう。

 その後、パソコンでGoogle Docsのツールにある音声入力を使用してみたが、マイクを使ってリアルタイムでやろうとしても、やはり音声を認識してくれず、なかなかうまくいかない。音声データを再生してテキスト化もしてみたが、特に環境音があると音声を認識してくれず、止まることがしばしば。音声の状態に大きく左右される。

Google Doscの音声入力でYoutubeの音声をテキスト化しているシーン。音声が聞き取りやすいと素直にテキスト化してくれるものの、ちょっとでも聞き取りにくかったり環境音が入ってくるとダメという印象。句読点もない

 それでもなんとかテキスト化してくれていたので、しばらく使ったが、句読点を打ってくれず、一定時間で停止してしまうため、効率はあまりよくない。取りこぼしも多く、話した内容がぼんやりわかるかな、という程度だ。

ワードのディクテーション機能がどんどん進化している

 その後しばらくして登場したのが、ワードのディクテーション機能だ。期待して使ってみたが、Google Docsの音声入力よりさらに音声の状態に左右されるものだったため、当初は使い物にならなかった。

 ところが、マイクロソフトが力を入れたのか、ある時期から飛躍的に音声認識率が高くなり、Google Docsを逆転。音声が小さすぎたり、ノイズが乗っていない限り、テキスト化する努力をしてくれるようになった。取りこぼしや認識率はやはり音声の状態によるものの、テキスト化された文書は、そこそこ読み取れるのでディクテーション機能へ乗り換えた。

 アクティブにしていないと止まるというのはGoogle Docsと同じだが、句読点を打ってくれるので、読みやすい(正しいかどうかは別)。ただそれでも、最初は一定時間で固まってしまい、再び実行しようとしてもなかなか実行できないなど、リアルタイムで利用するには少々不向きだった。

Microsoft 365のワードにあるディクテーション機能。Youtubeの音声をテキスト化してみたが、誤認識や取りこぼしも少々あるものの、どんな音声でも頑張ってテキスト化してくれる姿勢がいい。最近になってさらによくなっている印象だ

 ところがWindows 11になってから、今度はOSであるWindowsの音声入力の精度がかなり良くなり、句読点も打ってくれるし、ディクテーション機能よりも認識率が高くなったので、インタビューでリアルタイムにテキスト化に挑戦してみた。

 VAIO Zの内蔵マイクでも、対面にいるインタビューイの音声をしっかり拾ってテキスト化してくれ、これはスゴイとちょっと感動したものだ。同時期に同じ環境で行ったGoogle Docsの音声入力ではまったくダメで、やはり環境音や音声の質に左右されてしまう状態だった。

Windowsの音声入力はWinキー+Hキーで起動する。常に起動させておくこともでき、ワードに限らずあらゆるテキスト入力の場面で活用できる

 ただ、Windowsでも、やはり一定時間で固まってしまうのはディクテーションと同じで、それを避けるには、ある程度時間が経ったら、タイミングを計って一度止め、再び実行する必要がある。そのため、録音した音声をテキスト化するほうが作業的にはラクで、そうしてテキスト化したものは、それをもとに記事化できるレベル(そのまま使うのは無理だけど)で活用できるようになった。

 そして今、ワードのディクテーション機能がさらに進化して、認識率もWindowsの音声入力に近づきつつ、句読点はもちろん、途中でキー入力が可能になったので、改行を入れられるようになった。話者が代わったときや、流れが変わったときに改行を入れられるだけで、あとから認識しやすくなるため、かなり効率よくテキスト化できるようになってきた。

 また、いまのところ一定時間では止まることもないようなので、リアルタイムのテキスト化も夢ではない。固有名詞や聞き取りづらい発音だと誤認識が多いものの、筆者が考えるいま時点でベストなのはワードのディクテーション機能だ。

VAIO Zで音声を再生したものを入力する方法

 VAIO Zでは、PC上で録音データを再生したものを、そのまま音声入力することができない。マシン環境によっては「サウンドミキサー」というドライバーがあり、それを利用するとスピーカーで出力される音を音声入力できるのだが、VAIO Zにはそれがない。

 そのため筆者は、サウンドミキサーのように働くサードパーティー製のドライバーを導入している。筆者が利用しているのはフリーソフトの「VB-CABLE」だ。英語版だが、インストールすることでサウンドミキサーのように働いてくれる。

VB-AUDIO Softwareの「VB-CABLE」のサイト。ここからダウンロード

ダウンロードしたファイルを展開し、セットアップを実行する際は「管理者として実行」を選択する

インストーラーが起動して、実行するだけ。あとは再起動しよう

 インストール後再起動して、「サウンド」の設定で、出力を「CABLE Input」にし、入力を「CABLE Output」に設定。ただ、これだと音がスピーカーから出てこないので、「サウンドの詳細設定」で「録音」タブの「CABLE Output」を選択。「聴く」タブで「このデバイスを聴く」にチェックし、出力するデバイスを指定すると音声が聞こえるようになる。

サウンドの設定で出力、入力をそれぞれVB-CABLEにする

サウンドの詳細設定で「録音」タブにある「CABLE Output」を選択

「聴く」タブを選択し、「このデバイスを聴く」をチェックして出力先を選択する

 あとは、音声を再生するアプリを起動して再生、ワードのディクテーション機能をオンにすれば自動でテキスト化してくれる。ワード上でのマウスやキーボード操作は大丈夫だが、ほかのウィンドウをアクティブにするとテキスト化を終了してしまうので注意が必要だ。

自動テキスト化を活用して作業効率アップを目指せ

 最近のリモート会議では、Teamsだとミーティング内容のテキスト化機能も用意されているので、録音してテキスト化といった面倒なことをせずに済むことも多い。しかし、対面で会議をするときはそういうわけにいかない。

 筆者の場合、インタビュー時に別途マイクや録音機器などを使用せずとも、VAIO Z上でワードのディクテーション機能を起動しっぱなしにしておくだけで、結構音声を拾ってテキスト化してくれている。ネットワークにつながっていないと処理されないので、その点は注意が必要だが、こうした活用方法をマスターしておけば、必ずや生産性の向上に結びつくはずだ。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
1
【整備済み品】富士通 ARROWS Tab V727/V 12.3型 WUXGA+ タブレットPC Windows11 Pro MS Office H&B 2019 第7世代 Core m3-7Y30 メモリ4GB SSD128GB LTE対応 無線LAN Webカメラ タッチペン付属 USB-C 初期設定済み 中古パソコン
【整備済み品】富士通 ARROWS Tab V727/V 12.3型 WUXGA+ タブレットPC Windows11 Pro MS Office H&B 2019 第7世代 Core m3-7Y30 メモリ4GB SSD128GB LTE対応 無線LAN Webカメラ タッチペン付属 USB-C 初期設定済み 中古パソコン
¥9,999
2
Apple 2026 MacBook Neo A18 Proチップ搭載13インチノートブック:AIとApple Intelligenceのために設計、Liquid Retinaディスプレイ、8GBユニファイドメモリ、256GB SSDストレージ、1080p FaceTime HDカメラ - ブラッシュ
Apple 2026 MacBook Neo A18 Proチップ搭載13インチノートブック:AIとApple Intelligenceのために設計、Liquid Retinaディスプレイ、8GBユニファイドメモリ、256GB SSDストレージ、1080p FaceTime HDカメラ - ブラッシュ
¥98,789
3
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
¥37,800
4
【整備済み品】NEC 中古 ノートパソコン VKT10-6/第10世代 Core i5-10210Y/メモリ8GB, SSD256GB/12.5型 FHD/持ち運びストレスゼロ・A4より小さい・約953g超軽量 /Office 2019付き Win 11pro /Webカメラ内蔵/有線LAN・USB3.0・HDMI/テレワーク・出張に最適/有線静音マウス付属 /180日保証
【整備済み品】NEC 中古 ノートパソコン VKT10-6/第10世代 Core i5-10210Y/メモリ8GB, SSD256GB/12.5型 FHD/持ち運びストレスゼロ・A4より小さい・約953g超軽量 /Office 2019付き Win 11pro /Webカメラ内蔵/有線LAN・USB3.0・HDMI/テレワーク・出張に最適/有線静音マウス付属 /180日保証
¥20,380
5
【整備済み品】【Microsoft Office2019&Win11搭載】超軽量Panasonic Let's note CF-SZ6■第7世代 Intel Core i5-7200U@2.5GHz/メモリ8GB/
【整備済み品】【Microsoft Office2019&Win11搭載】超軽量Panasonic Let's note CF-SZ6■第7世代 Intel Core i5-7200U@2.5GHz/メモリ8GB/
¥16,000

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII倶楽部

注目ニュース

  • 角川アスキー総合研究所

プレミアム実機レビュー

ピックアップ
1
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
¥2,649
2
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 16 / 15 Galaxy iPad Pro MacBook Pro/Air 各種対応 (0.9m ミッドナイトブラック)
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 16 / 15 Galaxy iPad Pro MacBook Pro/Air 各種対応 (0.9m ミッドナイトブラック)
¥1,790
3
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
¥990
4
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
¥740
5
UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み 断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)
UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み 断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)
¥743
6
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ホワイト T-K6A-2630WH
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ホワイト T-K6A-2630WH
¥1,899
7
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GW
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GW
¥1,553
8
KIOXIA(キオクシア)【日本製】SDカード 128GB SDXC UHS-I Class10 読出速度100MB/s 国内正規品 メーカー保証5年 KLNEA128G
KIOXIA(キオクシア)【日本製】SDカード 128GB SDXC UHS-I Class10 読出速度100MB/s 国内正規品 メーカー保証5年 KLNEA128G
¥3,129
9
NIMASO ガラスフィルム iPad 第11世代(A16) 2025用/iPad 10.9インチ 第10世代 2022用 衝撃吸収 強化 ガラス 保護フィルム 指紋防止 ガイド枠付き NTB22I574
NIMASO ガラスフィルム iPad 第11世代(A16) 2025用/iPad 10.9インチ 第10世代 2022用 衝撃吸収 強化 ガラス 保護フィルム 指紋防止 ガイド枠付き NTB22I574
¥1,358
10
バッファロー マウス 無線 ワイヤレス 5ボタン 【戻る/進むボタン搭載】 小型 軽量 節電モデル 最大584日使用可能 BlueLED ブラック BSMBW315BK
バッファロー マウス 無線 ワイヤレス 5ボタン 【戻る/進むボタン搭載】 小型 軽量 節電モデル 最大584日使用可能 BlueLED ブラック BSMBW315BK
¥1,040

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

デジタル用語辞典

ASCII.jpメール デジタルMac/iPodマガジン