ここから本文です

MQAの音が良い理由 ニューロサイエンスが解き明かした聴覚の“真実”

10/31(火) 15:00配信

ITmedia LifeStyle

 ワーナーの大型楽曲配信やソニー“ウォークマン”の再生対応などで注目度が急上昇中のハイレゾオーディオフォーマット「MQA」。音が良いのに容量が小さいということで熱い視線を注がれているが、MQAに最初期から注目してきた麻倉怜士氏は「人間の感覚に寄り添う理論にこそ本質がある」と指摘する。MQAの開発者であり、麻倉氏の親友でもあるボブ・スチュアート氏にイギリスで取材し、音の特徴や開発の経緯などを詳しく聞いた。そこには最新の科学によって解明された、人間の驚くべき真実が隠されていた。

麻倉氏:今年になってからMQAが快進撃中です。音源は従来インディーズ系コンテンツがメインだったのが、8月末に大手のワーナーが3000タイトルの配信を表明、ユニバーサルやソニーもこれに続く動きを見せており、ソフトサイドが一挙にMQA化するという方向に流れています。

 IFAではLGエレクトロニクスがハイレゾ対応スマホ「V30」にMQA再生機能を導入。ソニーもハイレゾ対応ウォークマンの「NW-ZX300」「NW-A40」にMQA導入を発表し、「WM1シリーズ」もファームウェアアップデートで対応予定です。世界のハイエンドオーディオメーカー、マイテックやマークレビンソン、エソテリックなどでも導入が進んでいます。一昨年くらいから徐々に採用事例が出てきて、今年のIFA前後というタイミングでついに花開きました。

――音は良いけれど少々マイナーな感じのあったMQAですが、ここにきて一気に勢いが出てきた感じがしますね。これからはオーディオにおける台風の目になるのではと予感させます

麻倉氏:この連載でもMQAは何度か取り上げてきましたが、この度ついにイギリスのMQA本社を訪問しました。ロンドンから列車で北へ1時間、ケンブリッジ郊外のハンティントンという街にある、メリディアンオーディオと同じ社屋にオフィスを構えています。そこで開発者のボブ・スチュアートさんに話を聞きました。

 ボブさんとはこれまでにも何度も話をしていますが、MQAの最初の発想から今日に至るまでをきっちりと全容を聞いたのは初めてです。ということで今回はMQAの試聴も含め、どんな内容の技術なのかを、ボブさんへのインタビューを基づいてお話しようと思います。

麻倉氏:まずMQAはいつ聞いても自然で生々しい、音楽的な環境にあふれた音で、本当に驚かされます。今回の本社取材では、MQAのエンコーダー/デコーダーを追い込む特別な試聴室で聞きました。システムはメリディアン「ULTRA DAC」と、ウーファー用パワーアンプ、プリアンプで鳴らす、アクティブウーファーとパッシブスピーカーの組み合わせというもので、1991年のものをパワーアップさせた周波数帯域までしっかりと聞き分けられるものです。

 最初に聴いたのはピアノでした。曲名は分からないですが、192kHz/24bitのPCMと比較してMQA(おそらく44kHz対応のデータ量)はハンマーが叩いた弦の振動が胸板を通じて部屋に満ちていくという、響きの生成・解放の過程が目で見えるように感じられました。ペダルワークの有無でもぜんぜん違い、ペダルを踏んだときの倍音が非常に重層的で、波打つような倍音が出てきました。低音の力強さ、ガチッとした安定感・ピッチ感がすごかったです。それに比べてPCMは少々浅くドライでした。MQAで感じた、時間に沿って動くような細かい響きの数・文(あや)が少なく、響きの量自体も少ないように感じました。目の前でピアノが奏でられているのを体感するような現場感と、低音の持続といった特徴的なサウンドがMQAでは聞かれました。

――楽器的な音の印象として“音が良く飛ぶな”と僕は感じました。管楽器や打楽器でもそうですが、初心者の下手な演奏は鳴らした音が楽器の周りで止まり、上手い演奏は音がポーンと遠くまで飛びます。そういう“上手い演奏の感じ”がMQAにはありました

麻倉氏:確かにピアノの名手はどんなに小さな音でも音が飛びますね。高速度撮影で音の軌跡がゆっくり見えるような、そんな感じがMQAでは聞かれます。

 続いて聞いたのはチェスキーレコードの名作、レベッカ・ピジョン「Raven」です。176kHz/24bit PCMとMQAの比較で、MQAではピアノの響きが非常に芳醇になり、弦を叩いたときから発せられる直接音・間接音がリアルに出てきました。また、レベッカ・ピジョンのボーカルのリアルさも特筆すべき点です。人の声が生々しく、情感が付いてきたようなイメージです。体形を感じ、混じり合った感情を束ね、ボーカルという楽器になる様子をまざまざと感じさせるものです。

 もう1つ印象的なのは、単に音が出るだけではなくそこに“色”が混ざるように感じることです。PCMはフラットな感じで響きも多くはありません。確かにハイレゾらしい明確な感じはしますが、そういう次元でとどまっているのです。そこから先が情感として伝わってくる。これがMQAのすごさですね。

 田部京子、ジークハルト&リンツ・ブルックナー管弦楽団の「ベートーヴェン ピアノ協奏曲第5番“皇帝”」第2楽章。リファレンスとしてよく聞く音源ですが、これにもまたまたビックリしました。“皇帝”の第2楽章はゆっくりとしたパッセージの弦で始まりますが、MQAの音は単に楽譜の音をなぞっているのではなく、そこにさまざまな異なるニュアンスが詰まっています。第1バイオリンの中でもさまざまな楽器、さまざまな奏者の音が混ざり、トータルとして“第1バイオリン”というパートの音色を作っている。その細かな楽器の存在も分かるような感じです。

 ピアノの最初の入り方も本当に素晴らしいですね。静々と待っているオケの中に、すごく自然にピアノ(弱音)のオクターブで入る、その音の跳躍が実に細やかで、響きにさまざまな思いが入ります。PCMも同じような音は出てきますが、サラッと入ってきて、楽譜をなぞるよう。“思い”というところがちょっと、ですが明確に違うのです。MQAは“音”という物理現象を“音楽”という芸術に昇華にする力があります。楽譜から読み取った演奏者の思いや作曲者の意図といったものが、音になって耳から入って脳に感じさせる。感情を呼び起こす力ですね。

――単に聞き心地の良い音で通り過ぎるか、それとも素晴らしい音楽として訴えかけてくるか。音楽をやる人間が必ず意識するであろう要素を、MQAはフォーマットとして持っているように感じます

麻倉氏:マドリード・ユードラレコードのDSD 11.2MHzもMQAで対応するDXDの352kHzに変換して比較しました。DXDはクッキリとしてシャープで、力感がありカチッとしていました。これがMQAではまるで違い、低音の力強さと伸びやかさにバランスがあり、そこをベースに中域高域がバラエティー豊かに出てきます。響きが明らかに増えて、とても芳醇。響きの進行感、軌跡の複雑さといった、音楽を彩る情報が増えました。物理的なホールのリバーブも明らかに多く、音があちこちに反射して豊かな響きを作り出します。直接音と間接音が織りなす音の空間ドラマがより鮮やかでした。

 フランク・シナトラ「Close to you」も聞きました。1950年代のアナログ録音で、192kHz/24bitのPCMはいかにもというハッキリクッキリの明確な音です。一方のMQAは最初のバイオリンから生々しく、音が生きている印象でした。ビビッドに飛翔する感じがあり、ボーカルの生々しさも印象的でした。シナトラの上手さは歌詞の解釈とその歌い方にあり、歌詞に対して「こう歌うんだ」というシナトラなりの感情表現のメソッドが込められています。「Close to you」(あなたのそばに)という歌詞の“Close(近い)”という言葉の使い方でみると、元気がいいだけのPCMに対して、MQAでは音の深みによる意味が出てくるのです。感情が込められた音に対して、フォーカスがより正確に当たって噴出してきます。

 最も驚いたのはカメラータ・トウキョウから出ている、イタリアンピアノのFAZIOLIを使った録音「月の光」です。これはMQAのスゴさが分かる音源の1つでしょう。PCMは出だしが普通にキレイ、響きもサラッとしていて、いかにもハイレゾらしいスッキリとしたものでした。MQAでは演奏に差し込む白色の光が、プリズムで七色に分光して重層的に連なるという趣があります。MQAの良さは低音の持続性の生々しさ、粒立ちという点です。低音は赤、その上の中域は緑、高域は黄色や青、それが宙を螺旋状に漂う。自然で音楽に取り込まれる、魅力の増幅。そんな感じがいたるところで感じられるのです。

麻倉氏:MQAへの賛同はかなりのメーカーにのぼり、ボブさんによると現在進行形で話が進んでいるので、未発表のものがすごく多いのです。冒頭にワーナーのリリースを挙げたとおり、ついにソフトウェアメーカーの大手までも賛同を表明しました。プロフェッショナルだけではなく、誰にでも分かるレベルでMQAは音が違います。感動の力がスタジオのミュージシャンだけでなく、管理者や経営者までを動かしたのです。新時代の音楽的ハイレゾがここから始まる、それが理解されたからこその広まりです。

 音楽に宿る力を感じさせるMQAですが、その実態に関してはなかなか理解されているとは言えないのが実情でしょう。そこで今回、ボブさんに「MQAはどう考え出したのか」を聞きました。

――“オーディオ折り紙”など、技術的な点での関心を集めているMQAですが、FLACなどの単なる可逆圧縮フォーマットとは一線を画すものですね。そこには発想の飛躍があり、これを理解していないと「容量が軽くて音は良いけど、何をやっているかよく分からない怪しげな謎技術」となってしまいます

麻倉氏:ポイントは「音響心理学」(Psychoacoustics)とオーディオ」。音響心理学とは“人間は音をどう感じるか”という研究で、ボブさんは10代からこれを考えはじめ、バーミンガム大学と王立ロンドン大学でも音響心理学とエンジニアリングを専攻してきたスペシャリストです。当時から「音楽におけるナチュラルとは何か」を考えており、デジタルオーディオ時代に入るとその関心はアナログとデジタルの差に移りました。テープもビニール(レコード)も、アナログは入口から出口までがナチュラル。それに対してデジタルが自然ではないのはなぜか。どうしてデジタルは異質なものになってしまうのかという問題です。

 デジタルミュージックの曙であるCDが最初に出た時には「ノイズがない」「ワウ・フラッターがゼロ」「セパレーションが良い」「頭出しができる」といった、物理的な特性の良さが大きくクローズアップされました。しかしその音が周知されるにつれて「CDは音が硬い」「音的なナチュラルさに欠ける」など、いわゆる“デジタルっぽい”という評価も多く出てきます。一方で当時のPCMレコーダーが使っていたデジタルテープ記録フォーマット“ダッシュフォーマット”というものもあり、これは意外と良い音でした。CDと何が違うかというと、ダッシュフォーマットはデジタルフィルターが浅く、これによる弊害が少ないのです。ここから“フィルターの重要性”という着眼点が出てきます。

 また、ハイレゾは44.1k/96k/192kHzとサンプリングレートを上げる進化をしてきましたが、一定以上になるとデータ量が増えても音の良さは比例しなくなるという問題もあります。特に44.1kHzから96kHzと、96kHzから192kHz、192kHzから384kHzの音質向上は明らかに違い、サイズが大きくなっても音はそれほどは良くなりません。さらに2010年台頃はDSDが台頭し、一方で利便性を追求したAACやMP3といった非可逆圧縮が発展するなど、フォーマットが入り乱れてきました。音を良くしようとする方向性と、データ量を削ろうとする方向性。てんでバラバラな2つの方向性を統合したい。こういったところをボブさんはずっと考えていたのです。

麻倉氏:ボブさんはアップサンプリングコンバーターを開発するなどして、音楽メディアのデファクトスタンダードとなっているCDの音をいかに良くするかという問題に取り組みました。スタジオのマイクからのダイレクトな音とテープに録った音、それをデジタルに落とした(AD-DA変換をかけた)音を比較すると、明らかに違う。この差をいかになくすか。特にデジタル音声の時間軸変動を抑える「de-blur」(デ・ブラー)に苦心したそうです。

 カギとなったのは新サンプリング技術。オーディオ分野では長らくPCM(パルス符号変調)が用いられており全く変わっていないですが、宇宙や医療などのデジタル画像処理/サンプリング技術では近年目覚ましい発展を遂げています。そしてもう1つ、大きな変革をもたらしたのがニューロサイエンス(神経科学)です。音響心理学の専門家であるボブさんは、その考え方の違いに大いに刺激を受けたと話していました。

麻倉氏:音響心理学とニューロサイエンスでは、現象の捉え方が全く違います。音響心理学は端的にいうと、人間をブラックボックスあるいは1つの処理系統と捉え、音を与えたときの反応を現象として研究するものです。人間の聴覚と音の現象をリニアに考えて“A=B”と結論付ける、オーディオ的にいうと、物理的に20kHz以上は“聞こえない”とするのが音響心理学です。

 対してニューロンサイエンスは、音を与えた時に人間の神経はどのようなメカニズムで反応をするのか、つまり(音響心理学では)ブラックボックスとした人間の中身を分析します。“A=Bの間にあるメカニズム”をノンリニアで考える、オーディオ的には、聴こえないはずの20kHz以上の音が“人間にどう影響するか”を考えるという視点で物を見るのです。

――「音が聞こえる/聞こえない」という次元で考えていたものが、「これはなぜ良い音に聴こえるのか、そもそも良い音というのは何だ」というところまで踏み込み、それを神経伝達の視点から考えようという次元に昇格させたという訳ですね。確かにニューロサイエンスの考えだと「デジタルはノイズがない=良い」という単純な図式が崩れ、「デジタルとアナログの音の違いは何だ、それは人間のどんな反応を引き出すのか」と、より根源的な眼差しを向けることになります。これは明らかな飛躍です

麻倉氏:人間が自然界の音を聞く時、風や小鳥といったいろんな現象が合成され、1つのストリームとなって耳に入ります。これが脳内では1つずつに分解され「あれは雨の水音」「これは風切り音」「こっちは鳥のさえずりの反響音」と認知するわけです。ニューロサイエンスではこの統合と分解のメカニズムを研究します。

 2012年に神経科学研究者のMichael S. Lewicki准教授、翌年にJacob N. Oppenheim氏などが相次いて論文を発表しました。これによると、人間は時間に対して“超”敏感なのだそうです。音響心理学的な視点の従来論では、人間の時間的な分析力は50μsとされていましたが、そこで見過ごされてきたものをニューロサイエンスの視点で分析した結果、従来の5倍、つまり10μsで反応を示したとのことです。音楽家はさらに上回り5μs、指揮者はもっと上で3μs。それだけ人間の感度というのは繊細だということを、ニューロサイエンスは示唆しました。

 PCMの基礎原理であるFFT(高速フーリエ変換)では、分解された周波数しか分かりません。音響心理学のみの時代では特性分析しかありませんでした。ですがニューロサイエンスが入ることで、新しい扉が開きます。つまり96kHzのハイレゾ音源が良いのは、より細かいフーリエ変換によって時間軸解像度が上がるから。高音よりも時間の細かさが重要ということです。

――これは極めて重要な示唆です。ハイレゾの音が良い理由として、よく「デジタル化(標本化)が細かいステップになるから、元の滑らかなアナログ信号に近づく」と説明されています。大きなマスの方眼紙と小さなマスの方眼紙を並べた画像を見たことがある方も多いと思いますが、ボブさんはあの説明を「宣伝用に簡略化したもので、原理的に正しいとは限らない」と言っていました

 ハイレゾ化は単位時間あたりにより多くのフーリエ変換を詰め込む(=多くの定周波を重ねる)のであって、時間の刻み方(=方眼紙のマスのサイズ)が正確に小さくなるとは限らないというわけです。その時間的なブレの解消がボブさんの言う“デ・ブラー”。原理を知っていれば当たり前の結論ですが、常識を疑うことで新たな知見を導いたと言えるのではないでしょうか。

 ニューロサイエンスの導入にはもう1つ大きな発見があります。従来は年をとると聴覚が衰えて高音が聞こえにくくなるので「音楽鑑賞には向かない」と言われてきましたが、ボブさんによると時間の敏感さは年齢では変わらないそうです。人間は原初、音を危機管理の重要な情報として使ってきました。例えば原野で狼に狙われた際に、角度/方角/距離などを視覚と同時に聴覚で測り、生命を維持してきたのです。時間的な感度の高さはその名残りで、ニューロサイエンスによる分析の結果、聴覚の感度は本能的な部分で高いということが分かってきました。

 これがMQAとPCMの音の違いの原点です。MQAは時間軸解像度が人間の感度(10μs)に近いのに対して、PCMは50msが限界です。1ms(1/1000秒)は音がおよそ1ft(およそ30cm)進む時間で、その精度が出ないPCMでは1ftの距離の違いを描き分けられず、距離感が正確に出てこないのです。これは極めて大きな問題で、オーケストラでいうと、バイオリンと管楽器の距離の違いが、MQAでは分かるがPCMでは分からない、となります。MQAとPCMでは、音で感じる距離感のレベルがぜんぜん違うのです。加えてPCMには時間軸変動、つまりブラーが出て、時間的なフォーカス感が低下するという大きな問題もあります。

 ボブさんは最新サンプリング理論とニューロサイエンスという武器を携えて、これらの問題に対処する新しいデジタルオーディオ技術を開発していきました。大事にしたのはエンドトゥーエンドでやるということ。自然な音を出すにはトータルで時間軸精度をキープする必要があり、単に再生系でフィルターをかける(プレーヤー内でPCM音源にデ・ブラーフィルターをかける)だけでは効果が少ないのです。音源をMQAでエンコーディングし、それをプレーヤーでD/A変換する、これが重要です。

 さらにもう1つ、PCMは低、中、高の全音域が同じようなパワー感で処理していますが、MQAは人間の感度に合わせたミドルからアッパーまでを重視したエンコーディングをかけるというポイントもあります。これも近年の研究成果によるもので、自然の音は距離が遠くなるに従って、F特(高域)が下がるのです。例えば雷の音は、近いとバリバリという高域が耳に刺さりますが、遠い雷鳴はゴロゴロという低域が唸ります。時間とともに高域が下がる、それがつまり“自然な音”なのです。ちなみに近年の研究によると、スピーチなどでは周波数重視、音楽では時間軸重視が良いようです。

麻倉氏:MQAシステムをボブさんが作り上げる際に、まずデ・ブラーフィルター技術を主体にして時間軸解像度を維持、さらに“オーディオ折り紙”技術でデータ量を節約し、最終的にはDACで聞くという「ホールチェーン」を策定しました。そうしてできた試作機をボブさんはスタジオに持ち込み、世界中のスタジオエンジニアに聞いてもらったそうです。理論はもちろん、試聴による調整を欠かさないというのが基本姿勢です。

 ここで面白いのが、実際に音を聞いてプログラムを調整し、何度も繰り返すうちに、オーディオ折り紙で調整した音の方が高評価になったということ。ボブさんによると、ファイルサイズと音のクオリティーに関係はないのだそうです。これは「音質はデータ量によってある程度決まる」という、従来の常識を根底から覆すものです。ボブさんは90年くらいからロスレスコーデックの開発をやっており、その延長線上の感覚です。

 エンコーダーには多くのオプションがあり、どの音楽の時にどのDAWで制作した音源ならば、どのようなパラメーターを与えるべきかという最適解の選択を、AI的に学習するようプログラミングしているそうです。こういったことをロンドンや西海岸、モントリオール、東京などの世界中のスタジオで、2年かけて研鑽を積んできました。だからその名はMQA=Master Quality Authenticated(マスター品質として認証された)、世界のスタジオエンジニアのお墨付きなのです。

――ところで現状のMQA音源はすべてPCMからの変換ですが、これで音が良くなるのはなぜでしょう? そもそも録音の時点からMQAで作られた音源というのはまだないのですか?

麻倉氏:音が良くなるのはボブさんが丹精込めて開発したフィルタリング技術の賜物です。元の信号から時間軸変動を抽出して補正、本来の時間軸精度が復活するのです。音源に関してはまだMQA録音は出てきておらず、今後はPCMからの変換ではなくMQAダイレクトレコーディングに取り組むそうです。ちなみに最近ではMQA変換・再生を見越して、最適になるような工夫をあらかじめPCM録音で施すエンジニアも出てきたとか。

 そういうわけで、ADCに関しては現在2社が開発中。近日中に発表予定としていました。さらに、ライブストリーミング用のリアルタイムエンコーダーやイマーシブサラウンドといった展開を考えており、イマーシブサラウンドはチャンネルを増やすだけなので難しくない話していました。DACやスマホをはじめ、AVRにもどんどん入ってくる予定です。

――リアルタイムエンコーダーができれば、データ量削減で放送波に使うことも考えられます。いよいよテレビもハイレゾ化という時代は、案外すぐそこかもしれませんね

麻倉氏:DAC ICそのものにもMQAデコーダーが入ります。現在数社のICメーカーが開発している最中で、完成すればますますMQA対応製品が増えるでしょう。また、現在MQAの精度は10μsですが、アーカイブ用としてさらに高精度な2μsくらいの上位版も開発中とのことです。おそらくレコーダーはこのシステムが入ると見込まれます。

 問題は音の入口と出口、つまりマイクとツイーターです。現在のものはまだまだ周波数帯域が狭くボブさんは「200kHzくらいのものが欲しい」としていました。ツイーターも再現性に難ありです。理想はアナログイン/アナログアウトの直結で、ボブさんは現状を「100点満点中90点以上はいっているかな?」と評価していました。

――余談ですが、MQAの話を聞くと、ベルリン・フィルのトーンマイスターであるフランケさんの話が思い出される場面が多々ありました。音楽は“時間芸術”ともいわれており、ボブさんもフランケさんも“時間軸再現の重要性”を熱心に説いています。これは従来のオーディオでは見過ごされてきた要素なのではないか。これからのオーディオでは、時間軸に対する感度を高めることが重要になってくるように感じます

麻倉氏:これまでms(ミリ秒)やμs(マイクロ秒)といった細かな時間単位はあまり考えられていませんでした。ですがボブさんやフランケさんが指摘する音の立ち上がりやタテといった要素は、まさに時間軸の問題です。これからは従来の周波数ドメインはもちろん、タイムドメインが非常に注目されてくるでしょう。

――実はインターナショナルオーディオショウで、テクニクスCTOの井谷哲也氏さんに聞いた面白い話があるんです。フランケさんと井谷さん他数名で、PCM録り下ろし/MQA/ロスレス圧縮のブラインドテストをやってみたことがあるらしく、下位の票はバラけたのですが、“最も良い”評価は全会一致で“MQA”だったようです。これにはフランケさんも驚いたとか。まさに“Master Quality Authenticated”なエピソードだと強く感じました。

麻倉氏:MQAは音源におけるタイムドメインの技術で、音の軸は殆どの場合、スピーカーで狂います。これからはスピーカーのタイムドメインも重要になるでしょう。ベルリン・フィルで時間軸の重要性を学んだテクニクスなどは、次はスピーカーで時間軸の革新が入ってくるべきです。

最終更新:10/31(火) 15:00
ITmedia LifeStyle