J. Mailhot
哈里斯公司廣播通信部
(接上期)
其它壓縮音頻格式簡要評述
與Dolby E系統不同,另一些壓縮音頻格式(MPEG音頻、Dolby Digital、AAC-LC、AAC-HE等)被編排為不同于任何世界視頻幀標準的時間間隔的接入單元(壓縮音頻幀)。表1顯示目前使用的各種接入單元尺寸。

在制作中心發送預壓縮音頻,結果(對25Hz幀情形)示于圖2。從表和圖中可清楚地看到對準處不允許在視頻幀邊界上進行任意切換或編輯。

音頻和視頻的頻率參考和同步
數字音頻周期性地由基本上由話筒提供的模擬音頻信號的樣本組成。音頻數字表現的頻率保真度某種程度上由所用的取樣率決定。AES-3標準允許有許多不同的取樣率,而SMPTE-299嵌入標準強調把 “鎖定(同步)到視頻” 的48kHz取樣作為“首選”。事實上,與視頻同步的48kHz取樣在所有電視應用中都是最常見和最恰當的做法,未能采用這種做法是預壓縮音頻處理中最大的問題源。記住此忠告,讓我們詳細地查看問題根據歷史事實會出現過的幾個案例。

圖3表示一個典型的體育節目制作環境。音頻設備處理所有的現場音頻,制作一個5.1混音和一對LtRt立體聲以及關于此混音的元數據。在控制室監測混音,最終用Dolby E編碼以便返送到電視網。視頻被單獨處理,而兩者在此流程的最后會合。Dolby E編碼器從輸入音頻的取樣率獲得其頻率參考(如果它沒有鎖定到別的東西)。如果音頻設備的取樣頻率沒有精確地頻率鎖定到視頻參考系統,那么壓縮音頻將比視頻幀率稍快或稍慢地漂移,而收集編碼器將無法確切地混合這兩個信號。

圖4清晰地顯示在音頻鏈中增加一個參考信號以及一個取樣率轉換(SRC)步驟。此步驟如此重要,以至于它通常作為大部分Dolby E編碼器的一個特性包括;當然,還需要一個正確的參考得到恰當的連接和配置。注意縱使此圖忽略元數據同步,但如果此元數據是動態的話,同步元數據明智的。
一般說來,采用無論哪種必要的方式,在壓縮音頻前把音頻取樣率鎖定到視頻系統極其重要。
幀同步器有益
在大部分電視中心內,為了在切換前同步視頻信號,使用了幀同步器。每種情況下,即使對于正常的PCM音頻,問題“它如何處理音頻?”很重要。大多數播出幀同步器提供某種類型的音頻跟蹤選件,它(如果正確購買和配置)包括某種類型的取樣率轉換,以便連接輸入和輸出取樣率。對于PCM音頻,這是經多年實際使用證明成熟的技術。

如果同步一個有預壓縮音頻存在的信號,“如何處理音頻”變成一個極端復雜的問題。圖5示出此情況的例子。
在這個例子中,衛星信號來自節目提供商,有一個HD節目和預壓縮的Dolby Digital 5.1音頻。本地操作員希望切換這個信號和其播出服務器上的本地插入式廣告素材。為了節省預算,本地操作員推斷既然輸入節目的音頻已經在輸入衛星鏈路上被壓縮,而插入式廣告可在服務器內被安排已有壓縮音頻,本地操作員唯一要做的就是把輸入信號對其設備同步,并且切換它們,就像輸入信號為傳統的PCM音頻那樣。
此運營商很快就意識到兩個問題。第一,在衛星節目期間,觀眾投訴音頻有爆裂聲。這些爆裂聲幾乎每當幀同步器撤銷或重復一個視頻幀以便與本地電視中心同步時都出現。有些觀眾還投訴有大音像同步誤差,而有些觀眾則僅僅投訴爆裂聲。向廠商咨詢后,該運營商能夠購買幀同步器上所有恰當的功能和選件以正確地把預壓縮的Dolby Digital音頻同步到本地內部參考上,從而解決此問題。
在確信現在一切都沒問題后,操作員開始把來自本地播出服務器的廣告插入其新頻道。同一批憤怒的觀眾又開始投訴音像同步誤差和爆裂聲回來了。操作員檢查電視中心內所有設備的參考,可它們似乎全都正確。但問題依然存在。
這兩個問題的根本原因都相同—壓縮音頻的接入單元之間和視頻幀之間沒有校準,沒有很好的時間點切換視頻和音頻。幀同步器將跳過或重復全部視頻幀,以便在本地參考時間輸出它們的信號。對于與預壓縮音頻一起的音頻跟蹤,業內采取若干種方案:
·每當跳過或重復一個視頻幀時,跳過或重復全部視頻幀時間的音頻數據。這適用于Dolby E解碼器,原因是Dolby E解碼器有一種屏蔽功能,使跳過幀時間聽上去很好,而Dolby E接入單元與此視頻幀對準。對于其它壓縮音頻標準,這在音頻時間線內產生一個間隙,或更糟糕的是把一個或兩個部分的音頻接入單元放入下行信號。播出編碼器可能抓住和消除這些部分音頻接入單元,但它無法補救時間序列內的間隙。該問題一直傳到消費接收機,它們對此有與實現相關的不良反應。
·通過分析壓縮音頻信號,發現其內部的音頻接入單元,并在需要時跳過或復制接入單元。這種方案將產生一半左右的接入單元時間音像同步誤差。這也有與實現相關聯及標準相關的在接收端聲音不良的后果。即使音頻幀被“干凈地”消除或復制,大部分音頻編碼標準使用從一幀到下一幀的信息,在解碼器發現不連續時它們將強制重新同步。
·同步器能夠執行一個相當于解碼預壓縮音頻、取樣率轉換結果,然后重新編碼它的操作。雖然這大量占用資源,但在所有場合都有效。
即使在同步器經過升級,對Dolby Digital預壓縮音頻工作最佳,如果使用一個常規的視頻切換臺,在視頻幀和音頻接入單元沒有對準時依然不可能切換帶預壓縮音頻的兩個視頻信號。信號沒有對齊,而幀同步器必須處理的所有同樣的音頻連續性問題重新出現。
由于接入單元對準視頻幀,Dolby E可在播出設施內與視頻一起切換,而Dolby E解碼器被設計用于正確地解決不連續性問題。令人遺憾的是,此相同的功能沒有擴展到其它壓縮音頻格式。
管理延遲
每當音頻被編碼或解碼時,信號就被延遲。由于視頻信號沒有遇到這種延遲,它必須在電視中心的某處得到補償。大部分Dolby E編碼器和解碼器剛好在一視頻幀時間內完成工作,而其它編碼器和解碼器可能需長得多的時間(對某些編碼器來說,185ms是典型的延遲)。
當節目從一方傳遞到另一方(如節目帶或文件傳遞,或內部傳遞),在壓縮音頻和視頻之間精確校準的溝通極其重要。在Dolby E情況下,發送方可能預補償編碼延遲(增加一視頻幀延遲),因此Dolby E碼流在傳輸中與視頻一致;但接收方依然需要增加一視頻幀延遲以補償Dolby E解碼延遲。在其它情況下,發送方可能預補償編碼和解碼延遲,也可能都不要。在其它壓縮音頻格式的情形,通常由發送方補償編碼延遲,而把解碼延遲補償留給接收方,原因是在基于實現的處理延遲中有更多的可變性。提供方和接收方之間清晰溝通是此問題的唯一良方。
即使有測量音頻/視頻一致性的測試設備,清楚該設備正在實際測量什么以及在其測量中稱為“零“的結果也至關重要。
最易做錯的6種方式
頻率參考出錯
如何給大部分音頻編碼設備定參考有許多模式和選擇。正確的選擇取決于設施設計。但無論如何,音頻編碼器的SMPTE337M輸出必須與設施內的視頻信號同步。如果頻率沒有鎖定,那么在設備試圖修復它時將有爆裂聲。
V比特或通道狀態比特內的問題
雖然標準始終在改進,但依然可以找到少量對標準有不同解釋的設備??蛻舴词┙o廠商的壓力是對這些問題的唯一切實的解決方案。
保護帶未對準
即使在使用Dolby E而全部有關的設備都有正確的頻率參考時,也要求Dolby E音頻與視頻時間一致。有多種測試設備能夠測量此一致性,確保在幀掃描期切換的視頻與Dolby E內的間隙一致。
錯誤的期望
如果在未對準視頻幀結構的設備內采用一種壓縮音頻格式,則不可能在不大干擾壓縮音頻的條件下合理地切換節目源。如果要做除了將它直通之外的任何操作,最好的辦法就是解碼、以PCM運行設備,然后在輸出重新編碼,或采用一種幀對準的音頻格式。
未能處理靜態延遲
在電視中心內的每個位置,視頻和音頻的對準都必須有據可憑,而如果此設備將切換兩個信號,它們有相同的A/V一致性非常重要。盡管這似乎很顯然,但壓縮和解壓音頻的幀延遲易被忽視。
無正確的元數據
多聲道音頻編碼器通常攜帶一些元數據,使消費系統能夠為消費者家中特定的聆聽配置恰當地縮混多聲道音頻。此元數據必須一直在設備中存在,并且與視頻一起被切換。它與音頻本身一樣重要。在音頻為PCM格式時,VANC數據常被用于實現此目的,而Dolby E也提供一個元數據通道。
總結
為方便多聲道音頻包分發給消費者,現代播出設施信號流日益利用預壓縮音頻。這種技術提供極好的音頻質量,并且在現有播出設備的預算、布線和功能范圍內運作。如果在信號流設計、實施和維護中予以恰當地顧及,預壓縮音頻能夠提供優異的觀眾體驗。B&P
(全文完)