世界初タイトル「A Piazzolla by Strings and Oboe」を入手
フツーのCDなのに中のデータはハイレゾ、魔法の様な新規格MQA-CDを知る
2017年03月29日 18時30分更新
なぜMQAは小サイズと高音質を両立できるか?
MQAはすでに述べたように、小さなファイルサイズとハイレゾに匹敵する豊富な情報量を両立できる。
特徴は大きく2つある。第1に“音楽の折り紙”という独特の仕組みを使って、ハイレゾデータをCD並みのデータサイズに圧縮できる点、第2にタイミング情報が正確で音のにじみの少ない時間軸方向の精度が高い再生が可能になるという点だ。
現在、WAVやFLACで配信されているハイレゾファイルは、CDの2倍もしくは4倍のサンプリング周波数(44.1kHzを基準にすると88.2kHzまたは176.4kHz、48kHzが基準なら96kHzまたは192kHz)で、量子化ビット数が24bitのものが中心となっている。これにより0~100kHz近い範囲の周波数帯域と144dBものダイナミックレンジを持つデータを記録できる。
しかし、ここで注意したいのは、仮に192kHz/24bitの器があったとしても、人間の耳や空間認識など感覚に影響する情報は、全体の1/6程度に過ぎないということだ。
よくハイレゾ音源は、CDよりも細かい方眼の上に、波形をプロットできるので、より正確な情報が記録できると説明される。細かな音量の差異や、より正確な波形を知る上で、この細かい方眼は必要だ。しかし、すべての領域でこの精度が必要なわけではない。残りの5/6の領域に情報を入れても、ノイズとなり、情報としてあまり意味をなさない。MQAの肝は、この領域をうまく活用し、少ないデータ量でハイレゾに匹敵する情報を届けようとする点だ。
この“必要でない領域”のひとつは、録音時に発生するバックグラウンドノイズが占める部分だ。例えば、マイクが収音できる物理限界よりも小さな音(これ以下はブラウン運動になるとスチュワート氏は話す)などが当てはまる。
また実際に録音したデータを分析すると、演奏や空間認識に影響する情報は高域になるにつれて減衰していき、40kHzを超える付近で、バックグラウンドノイズと判別できないレベルまで小さくなってしまう。これらを配慮すると、下の図でいうオレンジ色の三角形の範囲が演奏を伝えるために必要な部分ということになる。
これを前提としてデータの圧縮をするのが“音楽の折り紙”だ。
MQAではまず超高域(48kHz以上)の領域のうち、音楽データだけをカプセル化して、24kHz~48kHzの領域に隠す。隠すのは、バックグラウンドノイズのノイズフロアーよりもずっと低い領域だ。次に2回目の折り紙として、24kHz~48kHzの領域に含まれる情報をロスレス圧縮し、0~24kHzの領域のうち-120dBより低い部分(図では-144dB~-168dBの付近)に重畳してしまう。この際-100dBぐらいの付近に、MQAでエンコードしたと分かる情報を付加しておく。これにより通常の機器からはPCMのデータとして見えるが、MQAデコーダーから見ると、この信号からMQAの信号であると判別できる。
以上がMQAのボブ・スチュワート氏の説明に基づき、192kHz/24bitのデータを48kHz/24bitのデータに小さくするプロセスを説明したものだ。これは一般的なMQAの説明に使うものなので、48kHz系での解説になっている。MQA-CDは44.1kHz系つまりCDと同じ44.1kHz/16bitの器の中に、176.4kHz/24bitのデータを入れこむ形になるため、上記の説明とは折り返しの位置などが若干異なる。
例えば、音楽の折り紙として折りたたむ周波数が22kHzと、44kHzになるはずだし、また量子化ビット数が16bit(96dB程度)と、24bit(144dB程度)より少ないぶん、ハイレゾ部分のデータを重畳する位置(16bitのうち何ビットまでを圧縮データの保存に使うか)が変わると思われる。
過渡特性に優れたエンコード・デコード技術も
なお、MQAはこの“音楽の折り紙”に加え“録音のクリーニング”と呼ばれる特徴がある。これはより正確なタイミング情報を得るため、エンコードおよびデコード時に生じる音のにじみをなくす仕組みと説明されている。
ハイレゾというと再現できる周波数の広さがアピールされがちだが、人間の感覚にとって重要なのはタイミング情報、つまり音の立ち上がり/立ち上がりや過渡特性の正確さである。これは空間の広さ、音の発せられた方向、その距離などを正確に知るために重要となる。
ハイレゾによって音の解像度が高まれば、本来、過渡特性の再現という意味でも有利になるはずだが、実際には録音時のA/D変換および再生時のD/A変換で使用するデジタルフィルターなどの悪影響が生じる点は問題だ。例えばインパルス信号を入れた際に発生するリンギングノイズ、プリエコーやポストエコーなどだ。インパルス信号は本来、短く鋭い信号だが、フィルターやアンチエイリアシング処理などによって、その山のすそ野が広がり音がぼやけてしまう。
MQAでは時間軸の分解能を10μ秒の精度をターゲットに処理している。仮に96kHzのサンプリング周波数なら1/96000≒10.4μ秒の精度があるはずだが、通常のPCMデータでは、192kHzのハイレゾデータでも500μ秒程度、48kHzでは数ミリ秒もの歪みが発生するという。
マイクで収音したデータをそのままスピーカーから流すことが、MQAの持つもうひとつのコンセプトだ。デジタルオーディオの制作/再生過程で発生する音のボケを排した最適化処理がなされている。