「昔のCDは現在と比べると音圧が低くてショボイ」というのは誤解である。
〜録音作品の音圧に関する話〜

diskjs

昔のCDを聴いた時に音圧が低いと感じた事はありませんか?

特にitunesなどのシャッフル機能で現在の音源と続けて聴いた時に顕著に差が分かると思いますが、実際に昔の音源は現在のCD音源に比べると音圧が低いように感じます。

このような場合、ほとんどの人は「昔の録音作品って何か音圧が低くてショボイな~」という印象を抱きますが(私もそうでした)、本当はそうでもなかったりするのです。

今回は近年ネット上ではしばしば話題になることもある、録音作品の「音圧」に関する話をしたいと思います。

どっちが良い音?

突然ですが、次の2つのロック風サンプル楽曲を聴き比べてみてください。あるパラメーターを変えてます。

どちらの方が良い音と感じますか?(どっちも良くないってのは勘弁ね笑)

A
B

おそらく、Bの方が良く聴こえた人が多いのではないかと思いますが、実際のところ2つの楽曲の「周波数のバランス」すなわち「音質」は同じで「音量」だけが違います。(※)

人間の耳の特性で音量を変えると聴こえる周波数のバランスが変化するというものがあるので、同じ音質(周波数バランス)の素材でも音量が大きい方が、小さい方よりヌケが良かったり派手に聞こえてしまうのですね。(特にロックやポップスに置いては重要な要素)

これは言い換えると音量が小さい方は大きい方に比べると「音圧が低い=ショボい音」に感じるということ。

しかし重要なのは、あくまで「第一印象」が変わるというだけで曲自体の「音質」は同じだということです。

※上記トラックはMP3なのでMP3変換時の差があるかもしれませんが、変換前のファイルは完全に同じ周波数特性になります。
音圧と音量の関係

「音量」とか「音圧」など似たような単語が並ぶとややこしいので整理しましょう。

「音量」というは音の大きさ。小学生でも分かるように説明すると、CDとかレコードに収録されている楽曲をプレイヤーで再生してスピーカーから出てくる音の大きさのことで、再生プレーヤーやアンプのボリュームコントロールで大きくしたり小さくすることが可能になっています。(んなこと分かるわい!っていう声が聞こえてきそうですが笑)

loudpercep

一方で「音圧」っていうのは、CDとかレコードに収録されている楽曲の平均音量のことを指すことが一般的に多いです。確かにそれで正しいとも言えますが、録音作品における平均音量はその説明だと少し誤解が生まれると思うので補足してみます。

例えば音圧が高いハードロックの楽曲と音圧の低いジャズの楽曲を聞き比べるとして、再生する時にハードロックの音量をジャズの1/3の大きさにして聴き比べるとどちらが音圧が高く感じるでしょうか?

間違いなく音量を大きく再生している後者のジャズの方が音圧が高く感じると思います。

つまり実際に我々が聴いて感じる録音作品の「音圧」はプレイヤーで再生するときの「音量」に依存しているので、録音作品の「平均音量」はその楽曲のもつ「音圧のポテンシャル」にすぎないといえます。

ƒvƒŠƒ“ƒg

ということで、実際のところ録音作品の「音圧」というのは「再生音量」によって高くも低くも出来るものなので、再生の時に適切な「音量」で再生しなければその「音圧」を正しく感じることが出来きません

そこのところを頭の片隅に置いて以下に続いていきます。

大きい音を求めて…

で、ここで元の話しに戻りますと、昔のCDが最近のCDより音圧が低くてショボく聴こえる理由は「音質」とか「音圧」の問題ではなく収録されている「音量」の問題であることがほとんどなのです。

実際に再生プレイヤーやアンプ等で音量を充分に上げて昔のCDを聴いてみると大体は気持ち良く聴ける事が出来るものだと思います。

では、なぜ昔に比べて現在のCDの「音量」は上がったのでしょうか?

その理由はやはり音量が大きい方が「第一印象が良くなる」からです。

先にも書いたように人間の聴覚は「音量」によって聴こえる周波数のバランス=音質が変わるため、一般的に大きな音のほうが小さな音よりもヌケが良く音圧が高くてカッコよく聴こえるのですね。

そして商業的成功のために重要なターゲットである「ライトなリスナー達」にとって第一印象の比重が大きい。

試聴機だったりラジオだったりでパッと聴いた時の印象で良し悪しが決まってしまうことも多いと思われます。(実際には収録されている音量は商業的な売上とは関係ないという調査結果があるようです)

となると、「録音のクオリティは同じなのに音量が小さいから、ライバルの楽曲より地味に聴こえてしまう!もっと音量を上げろ!」みたいな感じになってしまうのが自然の流れ。

このようにして次第にCDに収録する楽曲の音量を競い合うように上げるようになりました。

時期的には90年代の前期にその傾向が見え始め、2000年代で完全に一般化したという感じでしょうか。

限りある枠の中での競争

しかしながら、物事には限度というものがあります。

音というのは縦軸が振幅、横軸が時間軸の波形で表すことが可能で、ある意味それを変換して各メディアに記録するわけなのですが、メディアというのは要は「入れ物」なので容量に限りがあります。

例えばコップに水を入れすぎると溢れ出ますが、音の場合は各メディアに入れすぎると(過大入力)、音が歪み結果的に元の音から変化します。つまり音質が変わる。

ƒvƒŠƒ“ƒg

アナログの場合は電気信号に変換された入力を上げて信号(波形)を大きく記録しようとするほどに緩やかに歪み(波形が変化する)ます。一方でCD等デジタルメディアでは「0dBfs」という最大値までは基本的にデジタル変換された波形の周波数特性を保ったまま記録できます。

gainstage
良い感じに記録できる範囲のイメージ図

デジタルの場合この決められた枠の内側であれば「音量」を元の音質を完全に保ったまま上げたる下げたりすることが出来ますが、それ以上音量を上げるためには元の音質を変える必要が出てきます。

分かりやすく図で説明すると…

まずサンプルで作った楽曲のミックスダウン直後の波形を観てみると図1のようになります。

wave_org_
LRあるステレオファイル(2mix)のL側の波形図です。

ここで上下の赤い線がデジタル上での最大値になり、この線を超えた信号はスパっと切り捨てられて再生機器や人間の耳にダメージを与えるようなハードクリップという歪みとなります。

緑色の点線部分が平均音量で前述した「音圧のポテンシャル」です。ギザギザしているところは音のアタック成分で、私は音の空気感とか躍動感みたいのが主に入っていると思ってます。

この手の話題の中ではギザギザしているところの頭(ピーク)と平均音量の部分の差を「ダイナミックレンジ」と呼ぶことが多いので覚えておくといかも。ちなみに教科書的には「クレストファクター」と呼ばれます(多分)

平均音量の部分のタテ幅が大きくなるほど音量も大きくなるので、波形の振幅を増幅すると次第に最大値が赤い線に達します。この赤い線を超えない限りは元の音質を保っています。

wave_gained

ここから平均音量の部分を更に大きくするためにはどうするか?

答えは簡単。元の波形のギザギザしている部分のタテ幅をエフェクター等を使い圧縮してスペース空けて、全体のタテ幅を増幅することで平均音量を上げることが出来ます。

maximize
イチ・ニ・サン!で平均音量を上げるGIF動画(笑)

しかしながら言うまでもなくギザギザ部分を潰しただけ元の音質から変化することになりますし、潰してしまった波形から元の波形を完全に復元することは今現在の技術では不可能です。

アナログ機材ではこのギザギザした部分を激しく潰すとあからさまに聴いて分かるくらい音が歪んでしまいましたが、デジタル処理では歪みが目立たないように潰すことが出来るようになり、近年では安価で高性能なプラグインなどもあるため更に誰でも出来るようになっています。

ビフォーアフターで聴き比べてみる

ということで上記のサンプルで作った楽曲のギザギザ部分を潰して近年市販されているようなメジャーなCDとかの音量と同じくらいまで上げてみました。(※音量注意!)

この波形はこうなります。

wave_war

これが一般に海苔波形とか言われる形で、ギザギザしてるところが刈り取られてますね。

ここで元の波形とプロセス後の波形の音量を揃えると下図のようになります。これはitunesなどの再生機で聴感上で同じ音量にして並べることとほぼ同じ意味と考えてOK。また、近年実装されているYoutubeのラウドネスノーマライゼーションで動画の音量が自動的に揃えられた時の状態ともいえます。

compare
交互に入れ替わる図。波形の真ん中の薄い色の所がRMS値(平均音量)を表していて、同じ音量になっているのが分かる。

実際に聴いてみましょう。元の音源→プロセス後の音源の順で交互に代わります。

切り替わるタイミングの目安

どうでしょう、交互に音質が変化するのが分かりましたか?

私の主観ではギザギザ部分を潰した方の音源は元の音源に比べると、ギターの低音と奥行きが減ってドラムの躍動感も減ってしまっているように感じます。

ただ、このサンプルが元々ラウドなジャンルの音楽ですし(私の腕も良いし)、リスニング環境によっては「大して変わらないじゃないか」という人もいるかもしれません。(実際ノートPCのスピーカーじゃ分からない。)

でも考えてみてください、再生機で同じ音量にして聴けば感じる音圧は大して変わらないのに、元の波形(質感)を潰して第一印象のために「みせかけ」の音量/音圧を上げる必要性が果たしてあるでしょうか?

元の波形はミキシング行程で「あーでもないこーでもない」と試行錯誤して作った物なのに。

ちょっとくらいは必要かもしれませんが、個人的にこの20年の音はやりすぎだと思います。

音圧戦争/ラウドネスウォー

説明のところが長くなりましたが、このように「第一印象」を良くするために元の「音質」を犠牲にしてまで「音量」を競争するように大きくしてしまっている現状のことを一般に「音圧戦争」又は「ラウドネスウォー」と表現しています。

最初は商業的理由を伴う競争でしたが、次第にそれがスタンダート=「プロの音」という認識になり、別に商業第一ではない自主制作だったりDTMの個人クリエイターも「みせかけの音量」を求める事が正解だという認識になり今に至るのですね。

さらには近年過去の名盤のリマスタリング盤が多くリリースされていますが、このリマスタリングの工程でも「みせかけの音量」を求めて元々の作品の持っていたダイナミックレンジを著しく減少させてしまい一部で不満の声が上がったりしています。

ちなみにアナログメディアにも「音量」を求める傾向はあったようですが、アナログレコードの場合音量を大きくすると収録時間が短くなったり針飛びの原因になる等の物理的制約もあったためあまり主流にはならなかったそうです。

ショボイと感じる楽曲に遭遇したら…

上で提示したサンプルを聴いて、「なんだ大して元と変わらないじゃん、音圧戦争とか言ってるけど別に問題ないな」と思った方もいるかもしれませんが、今回ここで主張したいことは「音圧戦争を止めろ」ということではありません。

今回長々書いて世の中に主張したいことは…

ショボイと感じる楽曲に出会ったら、再生機側で「音量」を上げて聴いてみて
ということです。

もし再生機側で音量を上げて聴いてもショボイと感じるのであれば、それはもう「ショボイ」という評価で良いですが、音量が小さいゆえに不当に「ショボイ」と評価してしまうことがあったらもったいないと思うのです。

おそらく今後もずっと第一印象のため過度に音量を求めた音源が主流になると思いますが、一部では「みせかけ」の音量を上げない「バカ正直な」音源を発表する人も出てくると思います。(希望的観測)

今は情報化社会なので、発信力のある声の大きい人によってそういった音源を「ショボイ」と断定した情報が流されてしまったら世間一般のライトな層にはその評価がバイアスとなってそのまま受け入れられてしまうと危惧してるのですよね。

音圧戦争が終わらなくても、そういった小さい音量の音源を聴いて「ショボイ」と切り捨てられないような環境になれば良いなと録音音楽を愛好する者としては切に思うのです。

というわけで、ワタクシが製作に深く関わる楽曲があれば基本的に音量が小さくなると思うので、よろしくです笑

なお、今回サンプルでテキトーに作ったトラックは著作権フリーで配布してますので、よければどぞー↓
http://dova-s.jp/bgm/play5236.html

その他何か間違ってると事があったらメールtwitterで教えて下さいー

(終)

参考にしたページ