Youtubeのラウドネスノーマライゼーションを検証してみた。

当記事は2017年調べのものです。2020年現在は新しくEBU R128/ITU-1770のIntegaratedラウドネス-14LUFSでノーマライズされるようになっているようです。以下の文章は当時の記録としてお楽しみ下さい。 

この前ラウドネスメーターについて復習したし、今年からちょいちょい動画(基本動いてないけど笑)をyoutubeにアップロードしているので、ここはYoutubeのラウドネスノーマライゼーション(ラウドネス規格)について自分でも検証してみよう!っと思ったのでやってみました。

かなーり今更すぎますが笑

てことでレポっす

検証方法

まず前提としてワタクシ動画制作に関してはマジの素人なので、そこはよろしく。

自作曲「さっきと言ってたことと全然ちがう人のうた」をいくつかの音量にマスタリング。

それぞれの音量(Integrated Loudness)は、-16LUFS、-13LUFS、-12LUFS、-11LUFS、-10LUFS、-7LUFS、-5.7LUFSヘッドルームは最小でも-1dBFSを取ってます。(2曲-0.1dB誤差が出たけど気にしない)

それに加えて、-7LUFSのものと小さい音量のものを並べてIntegratedラウドネス値が-13LUFSにしたものも用意。

用意した楽曲を元にiMovieを使いmp4の動画にエンコード。iMovieは1080×1920のHD設定(オーディオに関する設定は出来ないらしい…)

これらの素材をYoutubeにアップロードして、どのような音量に調節されるのかをチェックしたいと思います。

まあ、ともかく聴いてみましょう。

あ、ちなみに動画をアップロードしてから音量が調整されるまで2日ぐらいかかりました。アップロード後にすぐに変わるわけでは無いようです。(※2018年12月追記:最近は割とすぐ処理されるっぽいです)

-16LUFSの動画

まずは-16LUFSの動画がどうなっているか確認してみましょう。

動画に使用した音声のラウドネス値。

元の音源のラウドネス値は図に表示されているように-16LUFS(Integarated)です。

youtubeにアップロードした動画の音声を測定してみたところIntegaratedラウドネス値が-16.3LUFSになり、ほぼ音量の増減は無いといっていいでしょう。

どうやら基準よりも小さい音量は大きくせずに、基本そのままになるようですね。

ダイナミックレンジが広く音量の小さな音源の音量を噂の-13LUFS程度に上げると大抵ピークに達してしまうので、当たり前っていえば当たり前ですね。

-13LUFSの動画

では次に非公式ながらYoutubeにアップするのに適しているラウドネス値という噂の-13LUFSの動画。

動画に使用した音声のラウドネス値。

元の音源のラウドネス値は図に表示されているように-13LUFS(Integarated)です。

ミックスダウンの状態からまだマキシマイザーでのリダクションは無い状態ですね。

youtubeにアップロードした動画の音声を測定してみたところ、こちらも音量の増減はほとんど無くIntegaratedラウドネス値が-13.2LUFSに。

どちらも約-0.1小さくなりましたね。

-12LUFSの動画

では次にさらにチョビっと音量(音圧)を上げた-12LUFSの動画

動画に使用した音声のラウドネス値。

元の音源のラウドネス値は図に表示されているように-12LUFS(Integarated)です。

ここから少しマキシマイザーによるリダクションが始まってきますが、まだピークでたまにリダクションされる程度。

youtubeにアップロードした動画の音声を測定してみたところ、こちらも音量の増減はほとんど無くIntegaratedラウドネス値が-12.1LUFSに。

これも約-0.1小さくなりましたけど、なぞです。

-11LUFSの動画

またまた少し上げて-11LUFSの動画。

動画に使用した音声のラウドネス値。

元の音源のラウドネス値は図に表示されているように-11LUFS(Integarated)です。

ヘッドルームを-1dBFSとっているので実際には-10LUFSくらいの音圧ですかね。

youtubeにアップロードした動画の音声を測定してみたところ、Integaratedラウドネス値が-12LUFSに。

ついに音量が小さくなりました!

-10LUFSの動画

またまたまた少し音量(音圧)を上げた-10LUFSの動画です。

動画に使用した音声のラウドネス値。

元の音源のラウドネス値は図に表示されているように-10LUFS(Integarated)です。

こちらもマキシマイザーでリダクションされCeilingを-1dBFSに設定しているので、実際には約-9.0LUFSくらいの音量のマスタリングといえますね。

そこそこ圧縮されているものの、ダイナミックレンジ的にまだ許容範囲といったところでしょうか。

youtubeにアップロードした動画の音声を測定してみたところ、Integaratedラウドネス値が-12LUFSになっていました。

ほうほう、どれも-12LUFSくらいになりそうですね〜

-7LUFSの動画

次にさらに音量(音圧)を上げた-7LUFSの動画です。

動画に使用した音声のラウドネス値。

元の音源のラウドネス値は図に表示されているように-7.0LUFS(Integarated)です。

こちらもマキシマイザーのCeilingを-1dBFSに設定しているので、実際には約-6.0LUFSくらいの音量で立派な音圧マシマシなマスタリングですね。

普段音圧上げない派ですが、やれば出来るんやで笑

youtubeにアップロードした動画の音声を測定してみたところ、こちらもIntegaratedラウドネス値が-12LUFSになっていました。

-10LUFSでアップロードした動画と同じ音量になりましたね。

でもこちらはiMovieでエンコードした時点で音声のピークが変動してしまったためか、youtubeにアップロード直後の音声でハードクリップが発生してたように思います。

mp4でアップロードしても音声って更に変換されるものなんですかね?iMoveieじゃないソフトでオーディオの設定をすれば変換されないのかな?(誰かおしえて)

まあ少なくともiMovieを使って音圧マシマシな曲を動画にする場合のヘッドルームは-1dBFSでは足りないみたいです。

-5.7LUFSの動画

でもってヤケクソにマキシマイザーに突っ込んだ(笑)-5.7LUFSの動画。

動画に使用した音声のラウドネス値。

元の音源のラウドネス値は図に表示されているように-5.7LUFS(Integarated)です。

ヘッドルームが-1dBFSなので、実際には-4.7LUFSくらいの音圧爆上げサウンド笑

ひでー音だ!

youtubeにアップロードした動画の音声を測定してみたところ、こちらもIntegaratedラウドネス値が-12LUFSに。

あんなにマキシマイザーに突っ込んで音を大っきくしたのに、ちっちゃくなっちゃいました〜笑

大小並べてIntegaratedを-13LUFSに調整した動画

最後に-7LUFSのものと小さい音量のものを繋げてIntegratedラウドネス値が-13LUFSにした動画。

動画に使用した音声のラウドネス値。

元の音源のラウドネス値は図に表示されているように-13LUFS(Integarated)です。

もしYoutubeがIntegratedラウドネス値を参照して調整しているならば、最初の音圧のままになると思いますが…

youtubeにアップロードした動画の音声を測定してみたところIntegaratedラウドネス値がなんと-17.1LUFSになっていました!

ちなみにMomentary Maxが-9.6LUFSでShort-term Maxが-10.7LUFS

最初の大きな音の部分だけの平均値は約-11LUFSなので今回の検証で一番大きい音になりましたが、Integratedは-17.1LUFSなので、どうやらIntegrated値で一括管理…みたいな事をしているわけではないようですね〜

検証結果からYoutubeのラウドネスノーマライゼーションを考察

さて今回アップロードした動画の音量変化の具合からYoutubeのラウドネスノーマライゼーションを考察してみます。

まず今回のテストでは以下の事が分かりました。

・ある基準以下の音量の動画は、音量の変化が無くそのままの音量になる。
・ある基準とは楽曲中のラウドネス値の最大が大体-11〜-12LUFS(short-term)になる具合だと思われる。
・EBU R128のIntegaratedラウドネス値で調整しているわけではない。

この結果から推察するに、Youtubeでやっているのはラウドネスノーマライゼーションというよりは、Youtubeで再生できる最大音量をShort-Termラウドネス値で-11〜-12LUFSに設定しているという考えが近い気がます。

例えば楽曲の中で一番音圧が高い部分がShort-Termで約-8LUFSの場合、全体の音量を4dB下げる…みたいな計算方法なのではないかと。(12-8=4→4LUFSの差=4dB下げる)

もし本当にラウドネスノーマライゼーションを目的とするならば、テレビ放送のようにもっと低いターゲットレベルを設定して、EBU R128のIntegratedを使ったほうが良いし、技術的に出来ないはずが無いですから。

で、個人的にラウドネス値の最大が大体-11〜-12LUFSっていうのは結構良い設定だと思うんですよね。

というのも、もしマキシマイザーが存在しない世界があれば録音楽曲(デジタルメディア)の音圧の最大値は大体-11LUFSくらいになると思うのです。

音圧の高いロックバンドのミックスをマキシマイザー無しでマスタリングすると、ラウドネス値は-11LUFSくらいになりませんか?それ以上の音圧は全体をディストーション的に歪ませたりしないと実現できないと思われます。(例外的な音になる)

これに動画変換によるピークの変動を考慮してヘッドルームに-1dBFSとると、-12LUFSになります。

そんな感じでYoutubeのラウドネスノーマライゼーションは、ある意味マキシマイザーが無い世界を表現してくれているのかもしれません。(あくまでワタクシの推察であって、Youtubeがそう意図してるか不明ですが)

だからYoutubeでは、例えば音圧が-16LUFSのアコースティックな楽曲と、音圧が-11LUFSのロックな楽曲を並べた時に、音量が調整された後でもロックの方が音圧が高くなります

ノーマライゼーションの一つの目的である、ボリュームコントロールからの解放っていう意味では機能しないかもしれませんが、音楽の表現という意味では結構健全な考え方かもしれないなーっと思いました。

だってロックの方が音はデカイもの。

まとめ:Youtubeにアップロードする音源で気をつけること

Youtubeにアップロードする音源で気をつけることは、ただひとつ。。

ヘッドルームを最低でも-1dBTP以上取ることです!

音圧を爆上げする場合は-3dBFSくらい取ったほうがいいけど、結局Youtubeでは-12LUFSくらいになるので他より目立とうとする目的で音圧を爆上げにする意味は無くなっていますね。

てゆーか良いミックス/マスタリングをしてカッコイイと思えるなら、どんな音量でもカッコイイままだ!

安心して音楽制作をしてください!

(終)