動態範圍壓縮器 → 專治音量忽大忽小

Last Updated:　2025-08-10　by Marvin

　　本文所介紹的動態範圍壓縮效果器，並不是每個人都需要的。即便真有需要，也請務必慎用！！！動態範圍範壓縮器的可調參數比較多，如果設置不當，可能產生意料之外的結果，某些字音甚至可能消失。因此電腦小白最好不要輕言嘗試！電腦駕馭能力較好的同仁，也應戒慎小心，在充分測試、反覆確認之前，不宜貿然套用。

【動態範圍】

　　動態範圍（Dynamic Range）可以理解為聲光訊號在最大值與最小值之間的差距。在攝影上，動態範圍是指畫面最亮與最暗部位之間的亮度差距；在聲音上，則是波形大小之間的差距。動態範圍太大的音頻，往往使聽者必須頻繁地調節音量——遇到聲音微弱的部分，趕緊將音量開大才能聽清楚；遇到聲音大的部分，又要趕緊把音量關小，以免太吵。

　　當我們遇到像上圖那樣的音檔，字音大小聲差距很大的時候，任何人所想要做的，大概都是想要把那些太小的波形放大，讓它們跟較大的波形不要差距這麼大。但是，當你面對的是一個長度有 20～40 分鐘的音檔時，全選 → 增幅是解決不了問題的。

　　上圖中，將波形全選之後，Audacity 的增幅自動給出的建議值「4.883dB」是以最大波峰處為準，放大了 4.883dB 之後，最大波峰處就會剛好觸及最大極限值；如果再放大，就會形成削波（clipping）了。但是看圖就知道，最小聲的字音只放大 4.883dB 仍是遠遠不夠的。

　　如果要靠「增幅」改善這個問題，必須要將波形 zoom in 到一定程度，然後，一小段、一小段的去微調。波形很小的段落，要放大很多；波形較大的就不用放大太多。所以，自從小牲接了後製工作以來，最怕的就是遇到讀稿比較「盡其在我」的同仁交出這種動態範圍超大的作品。因為實在生不出那麼多美國時間去一一細調啊！到這裡，可能有人會以為.... Audacity 的「正規化」（Normalize）可以解決這個問題，那麼請參閱這一篇，不要因為它的名字而抱持不切實際的幻想！其實，「正規化」和「增幅」根本沒什麼兩樣！

【語氣、情緒表現和音量的關係】

　　許多錄音者之所以會錄出動態範圍過大的成品，可能是誤以為帶有怒氣、斥責的話語，音量就一定要特別大。殊不知，真正有經驗的優秀配音員，在錄到一些喊叫或是帶有強勢語氣的語句時，會適時將上身退後、偏轉，也就是利用適度的遠麥、偏麥技巧，讓聲音不致產生振幅過大的波形。換句話說，喊叫、怒斥之類的語氣，在錄音時必須確實地喊出來、罵出來，否則就聽不出那種強勢的語氣；但我們在錄音技術上，還是要控制它的波形，不要讓它和正常的主述在波形上出現太大的差距。

　　為了破除上述的迷思，請聽 Daniel Lewis 的這一則 Podcast 錄音，請大家去聽 5'18" 開始的一小段（約 24 秒）聲音。其內容聽打如下：
　　Do not over compress your audio, because if you do, then you have no dynamic range. See people talk in varied levels of audio. Sometimes I might talk a little bit softer like I'm talking right now to convey a more connected personal approach. Sometimes they might just be really excited and they raise their voices. Sometimes I might shout, too! So all of this......

　　那個 Podcast 音檔是可以下載的，下載的音檔，是一個單軌的 Mono 音頻。上面聽打的那24秒的原始波形如下：

　　上面的 Mono 音軌，轉製成大家比較習慣的 Stereo 音軌，見下圖：

　　在聽感上，相信大家都覺得... shout, too! 那兩個字音是最強的，而 Sometimes I might talk a little bit softer like I'm talking right now... 則是最輕柔的。但對照波形來看，二者的振幅並沒有太大的差距；而且 shout too 那兩個字的波形，甚至也不是這段音頻中最大的！這個例子讓我們知道：
　　① 強勢的語氣並不需要特別大的波形來展現。
　　② 技法成熟的人，能將波形大小控制在較小的動態範圍內，而其中仍有語氣強弱、輕重的變化。

【壓限器】

　　大多數錄音軟體（包括 Audacity）中都有壓限器這類的效果器，其中通常包括 Compressor 和 Limiter 兩個類別。它們對波形振幅的「壓縮」和「限制」功能，其實就是針對動態範圍過大的痛點來解決問題（此處省略2000字）。不過，小牲曾經嘗試用 Cool Edit、Audition、Audacity 內建的壓限效果器，去處理一些令人頭疼的有聲書音檔，一直都沒能達成真正令人滿意的結果。

　　如果您的讀稿錄音習慣良好，每次只錄很短的一小段就停機編修、調音量，並且讀稿時比較遷就設備，編修時也會將振幅差距太大的波形適度增、降，以便縮減其落差，那麼這樣一小段、一小段接起來的作品，音量的均一性應該都還不錯，並不需要用到動態範圍壓縮。

　　但小牲在後製工作上遇到部分同仁的音量落差太大的音檔，要快速改善問題的話，也只能把腦筋動到壓限器上頭了。直到不久前，偶然接觸到了 Chris's Dynamic Compressor，經過許多的嘗試與測試，總算是找到了一個確實可行的解決之道。這個動態範圍壓縮器（v1.2.6）可以下載下來（就是那個 source code，不要懷疑！）作為 Audacity 的外掛效果器使用，以下簡單介紹安裝及使用方式。

　　【安裝】

　　下載、解壓縮之後，我們只需要其中的兩個副檔名為 ny 的檔案（見下圖），就可以外掛到 Audacity 上使用了。

　　首先，請將 Audacity 關閉。然後將那兩個檔案複製到 Audacity 安裝的資料夾中的 plug-ins 資料夾裡。以 Windows 64 位元的 Audacity 3.6.4 版為例，路徑應該是：
　　C:\Program Files\Audacity\Plug-Ins\

　　那兩個 ny 檔複製好之後，再打開 Audacity，Chris 的壓縮器應該就會出現在【效果】選單中了。如果沒有，可以嘗試執行【外掛程式管理員】搜尋一下。

　　展開 Audacity 的【效果】→【Compress dynamics...】選單，可以看到我們新增的外掛，事實上就是剛剛複製過去的那兩個檔案，一個是「compress-advanced」，另一個是「compress」。為了便於使用，可以打開【偏好設定】→【鍵盤快速鍵】將它們的快速鍵分別設成 F 和 D。前者（帶 advanced 的）是比較進階的，參數較多、較複雜。以下僅簡單介紹後者的使用要領。

　　【使用】

　　我們還是用一開始那個大小聲差很多的波形為例，將波形全選之後，按 D（因為我們先設好了快速鍵）打開 Chris 的壓縮器外掛，用圖中設置的參數，再按「套用」，出來的結果是相檔不錯的！

　　由上圖可以看出：原本音量微弱的幾個字音，被放大到跟其它語句相去不遠的水平；而原本就比較大的波形，並沒有按照同等比例放大，所以不致產生削波。這樣的結果，跟我們一小段、一小段用「增幅」純手工慢慢微調出來的效果雖然不完全相同，但已是可接受的程度了。重要的是，節省了大量的青春寶貴時間啊！

　　至於各參數的具體作用為何？原作者的說明文件並未提供非常詳盡的解說，但依據有限的描述和多次測試大致歸結如下：

Compress ratio	建議設在 0.5～1 之間，欲使弱音增強則調大些。
Compression hardness	數值越高，則壓縮得越激進。若聲音出現扭曲，則應降低。
Floor	低於此數值的波形不予處理
Noise gate falloff	如果大於０，會使低於 Floor 的波形減弱甚至消失
Maximum amplitude	設定最大波峰的上限
Use perceptual model	是否應用聽感模型運算，只有０或１兩種可能。

　　以上的參數中，特別需要注意的是：Floor 數值如果設得不夠小，容易造成預期之外的結果。有人會想：如果將 floor 的數值設大一點，再搭配 noise gate 的功能，不就可以去除一些細碎的雜音嗎？但做了許多測試之後發現，這是不切實際的想法。推判原因有二： ①我們很難抓到一個最佳的臨界值，使得最弱的字音剛好能被適度放大；同時更小聲的雜音又能被去除。 ②壓限器的運算法，可能也無法保證在臨界值上下做出如預期的兩種處理方式。下圖是原先那段波形再重新試一次，其他參數都不變，只有 Floor 增大到 -12，並將 Noise gate falloff 設成 3，結果有些較弱的字音就變得更弱，甚至消失了。

　　上面這個例子，就是 Floor 值設得太高了。以大多數波形偏小的有聲書音檔來說，-12 是偏高了，很容易搞出紕漏；設成 -32 甚至更低的數字，會是比較安全的。

【結語】

　　自從著手處理館內有聲書後製工作以來，部分動態範圍過大的音檔一直讓人很傷腦筋。其特徵為：許多段落的波形很小，播放時不開大音量是聽不清楚的；但偶爾又會有些字音出現特大的波形。如果要一小段、一小段局部去調【增幅】的話，必須耗費大量的時間、精力，所以曾嘗試使用 Cool Edit、Audition、Audacity 等軟體內建的壓限類效果器來處理，但試調了很多不同的參數、曲線，得出的結果一直都不太理想。

　　Chris's Dynamic Compressor plugin for Audacity 雖是很多年前的作品了，但最近嘗試之後，發現它可能是最適合用來處理我們有聲書音檔的工具了。由於其相關的 documentaion 並不完備，所以很難完全掌握其參數的調校要領，只能勤於測試、小心應對。電腦能力不足的同仁，最好別用。熟悉 Ctrl + Z 和 Ctrl + Y 的同仁，或許可以小心嘗試看看。

　　會錄出動態範圍過大的音檔的，往往是讀稿比較「盡其在我」的人，並且習慣一口氣要錄很長～很長～的時間才肯停機、編修。錄音者自己往往表示為了「情緒的連貫性」所以一定要錄較長的篇幅才肯停機——雖然其作品未必真有什麼情緒的表現——這樣錄成的音檔中，很容易出現波形大小的巨幅落差。聽者可能要在相當安靜的環境下很專注地聽，才能完全聽清楚內容。

　　因此，小牲始終認為最理想、有效率的有聲書錄製工作模式，應該是每次只錄一小段（約 40～100 秒）就停機編修。而且編修時，就將波形調到理想的大小，並將音量的變化控制在較小的動態範圍內。因為這樣短的段落，用【增幅】去調整是很簡單的事，然後這樣一小段、一小段接起來的音檔，音量、動態範圍都不會有什麼問題。而且在聽感上，也比壓限類效果器做出來的更自然、更不容易出毛病。

動態範圍壓縮器 → 專治音量忽大忽小

返回 Layman's Playground