音量的「正規化」是什麼奇妙的功能?

「正規化」和「增幅」有差別嗎?


Last Updated: 2023-04-30 by Marvin


  「正規化」也就是 Normalization,差不多是每個錄音軟體都有的基本功能。這個名字是不是引起了你無限的想像?如果我告訴你,它其實就是用來調音量的,而且它沒有什麼特別厲害的地方,跟另一個音量調整功能「增幅」或者稱作 Amplification 也沒有什麼差別,你相信嗎?以下就用 Audacity 的【正規化】來說明它作用。


  其實小牲最初開始摸錄音軟體時,乍看 Normalization 這個名字,以及關於它的一些說明文字,都曾有過一些不切實際的幻想。但是當你把相關的 documentation 仔細讀懂了(很不幸的,叫得出名號的錄音軟體差不多都是英文的,說明檔也是英文的),然後再實作驗證之後,夢就該醒了!




  從上面的實例可以看出,當我們錄得的波形有小、中、大三個區塊時,我們將這三個區塊「全選」起來,用「正規化」處理之後,音量被放大了;但小、中、大三塊波形彼此之間的相對比例仍然一樣如果你以為「正規化」可以自動幫我們調整音量大小不一的區塊,讓各區塊的音量趨於一致,那麼..... 請節哀!Normalize 並不能提供這樣貼心的服務。至於上圖中,為什麼「將峰值振幅正規化為」-1.0,而不是 0,請回顧前一篇關於 音量調整 的基本概念。









  上面實作的原始波形,若是不用【正規化】,改用【增幅】處理,經過 +5.271dB 的增幅之後,會得到完全相同的結果。不要懷疑,真的完全相同!其實 Audacity 的【增幅】功能因為可以設定目標值,所以它的作用和【正規化】可說已經毫無區別了。個人認為,這是 Audacity 的「增幅」比其他錄音軟體更好用的地方。





  請容小牲提醒:做任何編修、調整之後,一定要再仔細檢查,聽聽看有沒有造成什麼突兀、怪異的地方。了解原理才是王道,不要死記步驟。以上用 -1 作為正規化的目標值,通常適用在三、五分鐘以上的較長選取區段。如果只有短短的一句話,就要自行拿捏是不是該用 -3 或其他數字作為目標值。調整過後,一定要重聽幾次,看看音量是否合適、銜接是否自然流暢。








  那麼,我們最初那個不切實際的想像 —— 讓軟體自動幫我們調整選取範圍內,原本音量大小不一的各區塊,讓它們的音量趨近於一致 —— 有辦法做到嗎?



  首先,有些地方音量太大,有些地方太小,這和攝影修圖時遇到亮部、暗部差異太大一樣,可以說是 Dynamic Range(動態範圍)的問題。相機、修圖軟體有 HDR 功能來壓縮動態範圍,聲音編輯上其實也有類似的處理功能。許多錄音軟體上都能找到 Dynamic Range Processing 或是 Dynamics Processing 諸如此類的功能。但是 Audacity 並沒有,請節哀!






  上圖的實作,仍然使用原來那個例子(小、中、大3個區塊),音波全選之後先做「正規化」(目標值為 -1)把整體音量調大一些。儲存之後的聲音檔,以 Cool Edit Pro 開啟,用 Cool Edit Pro 的【Dynamics Processing】功能處理之後,三個區塊的音量就趨於一致了。灑花!



  好了,以上的示範,大家知道有這種處理的可能性就好。請不要貿然將有聲書的錄音檔套用這種做法!當原始音檔中,音量大小差異較大,然後用 Dynamics Processing 暴力拉平各區段的音量水準時,結果通常會聽起來很不自然。如果各位錄一段稿子,然後實際做一次,再仔細聽聽看,就會知道我在說什麼了。所以,如果在有聲書的音檔中發現有各區塊音量差異較大的情況,最好是分段去調整個別段落的音量(用「增幅」或「正規化」),這樣聽起來會比較自然。



  要用 Dynamics Processing 強行將各區塊音量拉到一致,通常需要將它的轉換曲線調成很極端的折線(注意到上圖中【Dynamic Range Processing】那個稜角分明的線條了嗎?),這使得說話聲音變得不太自然。如果調成比較滑順的曲線,則無法消弭音量大小的差異。以下示範一個比較有意義的 Dynamics Processing 實例:






  上圖是一段5分多鐘的交響樂。原始錄音的動態範圍很大,安靜的樂段和最壯闊的樂段音量差距相當大。這麼寬的動態範圍,在行車甚或一般居家環境聆賞都有些困擾,你可能不得不經常要將播放音量調大、調小。為了不要經常去轉播放裝置的音量,我們可以將音軌的 Dynamic Range 略作調整。請注意圖中那條滑順的曲線,不像之前那個稜角鮮銳的折線。動態範圍經過調整之後,最小聲和最大聲樂段之間的差距縮小了,但整首音樂仍然保有原本的強弱起伏形態,沒有強行拉成齊頭式一致的音量,也不致引起違和感。



  許多交響樂經過這樣的 Dynamics Processing 之後,在開車的時候聽,就能得到比較令人滿意的效果了。



返回  Layman's Playground