一. 電視音頻播出存在的響度問題
從目前廣大電視觀眾收看到的電視節目聲音來看,大家一定經常被這樣一個問題所困擾,那就是響度的不一致。主要體現在以下三個方面:1、同一個節目的聲音起伏;2、同一個頻道不同節目的音量差異;3、不同頻道的節目音量大小不一。這些問題的存在使得觀眾在收看節目和切換頻道時要不停地調整音量的大小以適應人耳的聽覺。比如談話節目的音量剛調好,出現了音量很大的廣告,觀眾趕快要把音量調小,否則就會覺得很吵;而廣告之后可能是電視劇,觀眾又要把音量調大,否則會聽不見臺詞。
從廣電總局監測中心對國內不同衛星鏈路接收下來的電視節目進行測量,發現伴音響度也相差確實較大,最大的相差有28dB,同一衛星鏈路接收的同一套節目不同時段節目響度也有較大差別,最大相差近6dB。所以,當我們展望數字高清化播出所帶來更完美的視聽感受時,作為電視節目播出機構,必須對聲音播出的基本要求有一個重新審視,需要研究數字音頻的播出將會對受眾帶來何種審美感受。
二. 與響度相關聯的基本概念
(1) 響度(Loudness),電信號轉換為聲波振動時度量聲音能量的一個指標,我們經常說的音量其實就代表了響度。響度是一個復雜的聲學仿真概念,用一個鮮為人知的單位(sone)來標示大小,它和聲壓級、頻率有密切關系,我們不必拘泥于嚴謹的物理聲學定義,只要理解響度代表聲音的平均能量以及響度的舒適度與聲音的聲壓級有關就夠了。
通常,一些非音頻專業的技術人員容易將電平和響度混為一談,錯誤地理解為控制電平就是控制了最終還原的響度。實際上,電平本身的度量有多種方法,如VU表、ppm表、dBFS表等,最接近人耳聽覺特性的是VU表,VU表指針或條狀圖的擺動特性可以大致描述信號還原為聲音時音量的變化,也就是人耳最終感覺到的響度變化,但也只是大致,并非特別準確,如果用ppm或dBFS數字表,則可能偏差更大,原因在于表頭的響應特性,只有VU表響應于音頻信號的準平均值,接近于聽覺特性,其余都是響應于音頻信號的峰值或準峰值,這類表頭通常只對控制信號的峰值有用。而響度的測量,過去一直借助于仿真的方法,過于刻板和不便,很少有音頻制作或電視播出部門參考響度的測量。
近年來,一些著名的音頻廠商加強了對響度測量及控制的重視。
dsp是digital signal processor的簡稱,即數字信號處理器。它是用來完成實時信號處理的硬件平臺,能夠接受模擬信號將其轉換成二進制的數字信號,并能進行一定形式的編輯,還具有可編程性。由于強大的數據處理能力和快捷的運行速度,dsp在信息科學領域發揮著越來越大的作用。
處理的方法,直接分析音頻信號,給出信號還原時標準的響度值并用傳統的電平表示(響度電平)。當然不同廠商在對信號分析時采用的方法有所不同,各大標準化組織也并沒有統一標準,盡管這很有必要,可出于商業上面的考慮,出現這種狀態是正常的。但就我國而言,由廣電總局選擇一種標準進行推廣普及,指導全國音頻制作和播出系統對節目的響度進行控制,應該說非常必要,不像過去依靠電平表的情況,響度測試儀給出一段時間內響度數字化值,不合適時簡單控制一下電平就可將響度控制在特定的水平。
(2) 動態范圍(Dynamic Range),人耳可感知的聲音在很窄20Hz?20kHz頻率范圍,但是動態范圍非常大,自然界從可感知的最微弱的聲音到耳膜無法承受的聲音,動態超過145dB,更大的聲壓可感知會傷害聽覺。如此寬的動態范圍,在轉換為電信號時,很難被忠實記錄及還原。當然,隨著電子技術的發展,這一局限已經越來越小但并未根本解決,我們只有通過調音師手動控制或壓限器之類的電子設備,對信號動態范圍加以合適的壓縮,保證在采集、存儲和傳輸過程中不出現失真,在此基礎上盡可能保持原有的動態范圍。大的動態范圍是HI-FI高保真音頻的追求目標,專業音頻工作者為此不懈努力,但對電視播出而言,卻有相應的問題需要解決。
三. 電視播出系統中音頻技術的特殊要求
與Hi-Fi領域不同,電視播出面向各種接收環境尤其是家庭和公共場所,在這類接收環境里,通常缺少良好的聲學條件,環境噪音差別較大。根據信號理論,信號只有在大于噪聲時才能被提取出來,因此,還原大動態音頻信號時,其中小于環境噪聲的部分將被淹沒掉,大的信號會被聽到,有可能帶來播放、傳輸、還原鏈路中某一個或多個環節中電子設備的幅頻特性失真。 另一方面,各類節目源響度差異過大和頻道間聲音響度差異過大,將會使得電視觀眾或廣播聽眾感到不舒服,統一響度和提供合適的動態范圍,是電視及廣播播出系統中需要解決的最為重要的問題之一,這一特殊要求獨立于專業音頻的所有要求之外。
典型的模擬廣播電視播出系統中有兩類信號源。信號源就是我們通常所說的信號發生器,信號發生器一般區分為函數信號發生器及任意波形發生器,而函數波形發生器在設計上又區分出模擬及數字合成式。一類是磁帶記錄的模擬視頻和音頻信號,這類信號由于載體是磁帶的原因,音頻信號動態范圍相對較小;另一類是由演播室通過銅纜或光纜傳送的直播信號,動態范圍可能大得多。為了平衡兩類信號的動態以保證播出后具有較好的一致性,需要在播出末級加壓縮限幅器及擴展器,對過大的信號進行壓縮和限幅,對較小的信號進行幅度提升,預先設置好動作閾值,由設備自動處理,統一信號的動態范圍,在一定程度上保證了音頻信息傳輸的有效性。數字化播出后,信號記錄的載體變為數字磁帶或硬盤服務器,對音頻信號而言,由于從前期采集到后期制作都在數字域內完成,系統鏈路設備可承載的音頻信號動態范圍有很大改觀,從模擬分量錄像機的60dB到數字錄像機的90dB動態,發射系統及有線電視傳輸系統數字化后也是這樣,動態范圍明顯改善。
播出傳輸系統設備的動態范圍相繼統一,那么接收情況如何呢? 數字衛星、數字無線及數字機頂盒接收方式具備解調大動態范圍音頻信號的條件,根據發送端編碼設備使用的壓縮編碼方式不同,接收端可以還原的動態范圍也有些差異,但相比較無線模擬開路接收和低碼流的新媒體接收方式而言,更加符合專業音頻的要求。
最終的音頻信號還原也大致分幾種,情況比較復雜:HI-FI家庭影院系統當然可以獲得很棒的信號還原效果,問題是絕大多數電視接收觀眾是直接用電視機喇叭來還原聲音的,優質喇叭系統可能還原的動態也許能達到較為理想的效果,而劣質喇叭系統就很難說,這一點相信每個聽力正常的人都會有切身體驗。其他還有一部分受眾使用多媒體音箱、手機喇叭或耳機還原節目聲音的,聲音還原條件可謂千差萬別。
四. 可供選擇的響度及動態控制技術[page]
今天,我們有多種技術可以選擇,這幾種主流的響度控制技術分別得到不同電視播出機構的認同,包括JUNGER公司的LEVE MAGIC R、杜比實驗室的元數據技術以及TC公司的響度控制技術,甚至有芯片廠商參與其中,他們熱哀于提供各種響度處理的大規模芯片,使得聲音的響度處理變得更加容易。
1. T.C.Electronics
T.C.Electronics是一家傳統的音頻處理設備生產商,目前可以支持AES/EBU及SDI嵌入音頻實時響度及動態范圍處理的設備DB-4和DB-8在中央電視臺播出線上使用,TC處理響度的獨特之處在于它將響度和動態范圍結合在一起處理,用戶可以調用很多國外電視臺在響度和動態范圍處理方面的參考數據,然后根據自己素材的特點修改這些參數獲得適合的播出效果。
2. Level Magic
Level Magic是德國JUNGER公司的專利技術,基于Level magic的設備目前支持大多數音頻接口,包括模擬、AES/EBU、SDI嵌入音頻,支持斷電旁通,適合播出線使用。盡管響度和電平是兩個不同的概念,但是二者具有一定程度的聯系,前面提到,當我們用信號的準平均值來表示信號電平大小時,這時電平和信號還原出來的響度就具有較好的一致性,因此,通過高速檢測信號的平均值電平,根據壓縮擴展規則進行高速處理,可以比較理想地控制信號還原的響度,這就是Level magic的基本原理。
3. 杜比實驗室
杜比實驗室在聲音響度控制方面有長期的研究和經驗積累,他們于2004年推出獲艾米獎基于Leq(A)特性的LM100響度測試儀,并陸續提出了幾種響度控制解決方案。
(1) 元數據技術控制還原
杜比元數據技術的原理是,借助于在杜比數字(AC-3)或杜比E(DOLBY-E)數字音頻流中加入標識音頻信號響度的元數據,含元數據的音頻信號到達接收端后,由接收端的機頂盒根據元數據決定信號還原時的音頻增益大小,從而使得聲音還原時具有合適的響度,同時動態范圍并不壓縮。
杜比元數據技術的特點是它不對信號進行任何處理,只是分析出節目信號的響度大小,響度值就是元數據的內容,機頂盒讀取元數據并做出正確的響度還原。和其他一些廠商有所不同,杜比實驗室的理念是內容提供商不能只照顧普通接受條件而犧牲那些具有高端接收條件的觀眾的滿意度,通過對機頂盒的接收參數設置,各類用戶得到各自需要的響度和合適的動態范圍。元數據技術應用的前提是用戶接收的音頻數據流中必須包含準確測量的響度數據(元數據)、音頻數據流必須是杜比數字或杜比-E編碼格式、接收端機頂盒支持元數據技術。
無可置疑,元數據技術相比較傳統的音頻信號處理具有明顯的優越性,如果每個節目制作單位、每個頻道都能應用杜比的元數據及編解碼技術、每個用戶都具備支持元數據的機頂盒或解碼器,那么,我們目前面臨的響度差異問題就可以完滿解決,這真是太好不過了,至于動態范圍,我們可以在播出系統的不同出口使用在線處理的傳統方法解決。
(2) 基于文件處理的DP600
杜比實驗室可能已經意識到,元數據技術在中國推廣具有不小難度,不用說目前國內的機頂盒廠商不支持元數據技術,就是現有廣電音頻系統的重建,難度也是可想而知,因而杜比在2007年又推出了基于文件處理的響度控制器DP600。
DP600按一定的策率從視頻服務器讀取素材,從中抽出音頻數據流進行短期或長期響度分析,并把它調整到預先設定的響度水平,處理過后的音頻流重新打包回去成為可以正確播放的文件。盡管對原始文件進行了響度處理,但依然不破壞原始文件的動態范圍。如果所有播放的素材都是經過響度處理,這樣大家的響度就一致了,這正是我們期待的結果。
(3) 接收端直接處理(Dolby Volume)
和前兩種處理不同,Dolby Volume直接面向消費類電子設備,對響度的控制完全獨立于節目提供商和節目類型。杜比在2007年初推出Dolby Volume技術,很快得到了芯片廠商的積極響應,Cirrus Logic在2007年11月正式發布支持Dolby Volume技術的CS48DV2/6系列DSP處理芯片,相信2008年高端消費類電子很快就會出現支持這一技術的產品。
不管是元數據還是基于文件對響度進行處理,杜比實驗室把它的響度控制技術命名為對白歸一(DialNorm),這有點容易讓人產生誤解,因為事實上我們播出的音頻節目形式多樣,組成元素復雜.除了對白,還有獨立的音樂、效果以及作為背景與對白混合的音樂和效果。那么為什么Dolby只關心對白呢?
根據杜比的研究,入耳對節目中的人聲(也就是對白)相對于音效來說要敏感得多,并且不同的人對于同一段對白響度的認知度一致性非常之高,對白響度變化+1.0dB/-3dB,大多數人會立刻感覺到,響度變化超過+2.0dB/-5.0dB,大多數人就有不舒服的感覺,中間的容限很小,音樂則不同,容限超過12dB,并且不同的人對音樂響度的不一致性非常大,相信這個研究結果對大家會有很明確的啟發:只要我們有效控制了節目中對白的響度,就不會讓觀眾感到不舒服;如果能讓所有節目中的對白和所有頻道播出的對白響度一致,觀眾就不會對節目間和頻道間響度的大幅度跳變感到厭惡。我們認為杜比拋開音頻信號復雜化的表面抓住關鍵因素的研究卓有成效,對音頻處理技術的進步是一個貢獻。
那些不含對白的節目怎么辦呢?比如純音樂、無人聲的廣告。由于人耳對這類信號響度的容差較大,關鍵還是控制其平均響度,同樣可以采取對白歸一化處理,如果需要對廣告等特殊節目提高一定的響度,可以在對其歸一化處理時采取偏移目標響度值的策率,將其響度適當提高0.5?1dB,在一定程度上迎合廣告投放商和專業音樂制作人,同時不至于得罪觀眾的耳朵。
五. 結語
以上分析了幾種主要的響度控制技術,就我們當前大多數電視臺節目制作和播出的情況來看,在線式傳統的壓限處理依然可以發揮作用,元數據技術應用離電視播出系統可能還很遙遠,基于杜比對白歸一的文件處理技術對于以硬盤播出系統為主的有很好的應用價值。