數(shù)字音頻編解碼是目前支持全部新興的聲音廣播和分配格式的基本技術(shù)。因此,了解其運(yùn)行、價(jià)值和各自的特征對(duì)于廣播專業(yè)人士可能是有用的信息,在設(shè)計(jì)未來(lái)的制作和傳輸系統(tǒng)中他們目前正面臨重要和影響深遠(yuǎn)的選擇。
數(shù)字音頻純凈的質(zhì)量廣為人知,但其代價(jià)也是高昂的。產(chǎn)生這樣的保真度所要求的數(shù)據(jù)量極大。聽(tīng)眾為獲得滿意的高質(zhì)量聲音體驗(yàn)實(shí)際上不需要此數(shù)據(jù)的全部。只要您保留有價(jià)值的比特,您可以把信號(hào)內(nèi)大部分的比特丟掉。
知道保留哪些比特是編碼算法的任務(wù)。其顯見(jiàn)的好處是在無(wú)大的音質(zhì)降低的條件下大幅降低對(duì)數(shù)據(jù)存儲(chǔ)或傳輸帶寬的需求。
編解碼器實(shí)施有損壓縮,意味著編碼期間刪除的數(shù)據(jù)永遠(yuǎn)不能恢復(fù)了。而無(wú)損壓縮(如PKZIP、WinZip或StuffIt等的文件打包系統(tǒng)采用的類型)中,編碼處理中刪除的全部比特在解碼階段全部可以重建。
無(wú)損壓縮并非簡(jiǎn)單地尋求更有效的冗余比特圖編碼方式,相反它利用終端用戶的知覺(jué)缺點(diǎn),因此能采取在無(wú)顯而易見(jiàn)影響的前提下大幅減少數(shù)據(jù)的方式自適應(yīng)地處理數(shù)據(jù)。這意味著有損系統(tǒng)是針對(duì)某一被處理的特別類型數(shù)據(jù)而設(shè)計(jì)的,而無(wú)損壓縮可以適用于任意類型的數(shù)據(jù)文件。通常無(wú)損壓縮系統(tǒng)最多只能壓縮文件尺寸到1/2或1/3,而有損系統(tǒng)能降低高質(zhì)量音頻數(shù)據(jù)比特率到1/10或更少。
有損音頻編解碼器利用稱為掩蔽的人耳聽(tīng)覺(jué)現(xiàn)象,利用掩蔽,較大的聲音降低聽(tīng)眾聆聽(tīng)鄰近頻率處較安靜聲音的能力。通過(guò)降低數(shù)字音頻信號(hào)的分辨率,編解碼器被編程以利用此能聽(tīng)度的暫時(shí)降低。這樣一來(lái)必然增加信號(hào)內(nèi)的噪聲和失真,但如果此編解碼器把這些討厭信號(hào)置于由掩蔽產(chǎn)生的倒靈敏度流動(dòng)區(qū)域,此劣化一般是可以忽視的。此所謂的噪聲整形技術(shù)對(duì)于編解碼器在采用線性編碼時(shí)會(huì)產(chǎn)生非常討厭的聲音的數(shù)據(jù)率下產(chǎn)生與CD相匹敵的音頻質(zhì)量的能力是非常關(guān)鍵的。因此,不需要10MB/min,低于1MB/min就能產(chǎn)生高保真音頻,這是編碼效率一個(gè)數(shù)量級(jí)的提高。
但像任何高效的技術(shù)一樣,數(shù)據(jù)壓縮在應(yīng)用中也有局限性。其中一個(gè)特別嚴(yán)重的問(wèn)題是多代效應(yīng),當(dāng)音頻信號(hào)在從音源到終端用戶的路徑上被相同或不同的編解碼器重復(fù)編碼/解碼,就可能發(fā)生此效應(yīng)。因此應(yīng)用這些技術(shù)時(shí)必須全盤系統(tǒng)考慮。
許多公司和標(biāo)準(zhǔn)組織正在堅(jiān)持不懈地改善編解碼性能,在給定的比特率下可以達(dá)到的最佳音頻質(zhì)量還在不斷提高。目標(biāo)是與CD的感覺(jué)音頻質(zhì)量相媲美,而目前最新的編解碼器欲在64kb/s范圍內(nèi)實(shí)現(xiàn)此目標(biāo)。盡管某些專業(yè)人士能在某些條件下聽(tīng)出編碼失真,但實(shí)際目標(biāo)是對(duì)準(zhǔn)典型環(huán)境下的主流聽(tīng)眾。編碼失真的能聽(tīng)度還隨著音頻內(nèi)容的變化而變化。往往是話音內(nèi)容,而非音樂(lè),最突出暴露編碼失真。這也許與直覺(jué)相抵觸。
目前這些低碼率(LBR)編解碼器用于計(jì)算機(jī)上的因特網(wǎng)流式媒體,或用于在專用消費(fèi)電子硬件(如MP3播放機(jī)和衛(wèi)星收音機(jī))上廣播或下載音頻。這些方案間的主要區(qū)別在于前者涉及一條與計(jì)算機(jī)設(shè)備的雙向線路,允許頻繁地下載解碼器更新軟件;而后者通過(guò)單向或離線線路尋址專用設(shè)備,意味著此編解碼器的解碼器通常是在工廠“嚴(yán)格鎖定的”。因此,由于后續(xù)變化可能使傳統(tǒng)設(shè)備不兼容,在消費(fèi)電子硬件情況下的編解碼器選擇更關(guān)鍵,耗時(shí)也較多。注意這并非完全排除專用設(shè)備未來(lái)的性能改善。盡管在這些消費(fèi)產(chǎn)品中解碼器必須維持不變,但廣播機(jī)構(gòu)的編碼器仍可以繼續(xù)改善其壓縮信號(hào)的創(chuàng)建,而且只要其輸出始終忠實(shí)于標(biāo)準(zhǔn)格式。在格式有效期一般這能有20%~30%的質(zhì)量改善。
對(duì)于更新的消費(fèi)設(shè)備來(lái)說(shuō),憑借單邊的純解碼擴(kuò)展也可以提高其標(biāo)準(zhǔn)信號(hào)的解碼能力,就像目前基于DSP的新型FM接收機(jī)聲音優(yōu)于早期機(jī)型,或Dolby Pro-Logic性能優(yōu)于原來(lái)的Dolby Surround性能,但又不需要改變內(nèi)容的編碼格式。在當(dāng)前的編解碼器中,類似這樣的技術(shù)稱為頻帶復(fù)制(SBR),有別于MP3的mp3PRO或AAC的aacPlus。
業(yè)界另一最新消息是采用專有的“預(yù)處理”。就像常規(guī)的廣播音頻處理,但這些處理器計(jì)劃用特別方式制備信號(hào),使之經(jīng)受得住編解碼器的編碼和解碼處理并有更高的保真度。最近的一個(gè)例子是Neural Audio的Neustar系統(tǒng),它目前在XM衛(wèi)星廣播系統(tǒng)中用作aacPlus編解碼器的一種預(yù)處理器。
并非所有編解碼器都是不相上下的,因此選擇很重要。編解碼器之間的差別有技術(shù)上的和商業(yè)上的。
在技術(shù)方面,每個(gè)編解碼器是為某一目標(biāo)功能而優(yōu)化的,雖然它們大多數(shù)都能工作在各種比特率和環(huán)境下,但始終有一個(gè)工作“舒適點(diǎn)”。
這對(duì)目前的HD Radio系統(tǒng)提出了一個(gè)特殊的問(wèn)題,因?yàn)槠溟_(kāi)發(fā)商計(jì)劃對(duì)AM和FM系統(tǒng)采用一種編解碼器,但兩種系統(tǒng)的比特率大不相同。AM系統(tǒng)采用36kb/s,這是在在線領(lǐng)域的“撥號(hào)”上網(wǎng)比特率范圍內(nèi),而FM系統(tǒng)采用的96kb/s被視為寬帶環(huán)境的低端。并非全部編解碼器在此廣范圍內(nèi)都能最佳工作,這是Ibiquity的PAC編解碼器目前面臨的難題。此解決方案可能要求為系統(tǒng)增添一個(gè)輔助編解碼器,或選擇一個(gè)能很好地自適應(yīng)于各種要求的數(shù)據(jù)率的編解碼器。
商業(yè)方面,采用者把這些編解碼器置于其產(chǎn)品內(nèi)需付的許可費(fèi)用也千差萬(wàn)別。有些編解碼器由其擁有者單方面發(fā)放許可,即專有系統(tǒng),而其它的則由許可證管理部門發(fā)放。基于標(biāo)準(zhǔn)的系統(tǒng)根據(jù)合理和非歧視條款向所有實(shí)施者發(fā)放許可,而格式通常在相當(dāng)長(zhǎng)時(shí)間內(nèi)是凍結(jié)的,而專有系統(tǒng)無(wú)這種本質(zhì)的保證。另一方面,專有系統(tǒng)現(xiàn)在普遍向采用者提供便宜的許可項(xiàng)目,因此根據(jù)應(yīng)用的情況,哪一種方案都可能有益。