J. Mailhot
哈里斯公司廣播通信部
【摘要】 在電視制作和分配中心中,處理和傳送被用各種技術(shù)壓縮的多聲道音頻包的工作日益增多。本文討論在視頻同步、處理和編碼環(huán)境下處理和傳送這些預(yù)壓縮音頻包的各種損害和誤差源。
引言
隨著許多國(guó)家推出高清電視服務(wù),多聲道音頻制作和分配工作激增。多聲道音頻制作多年來(lái)是電影行業(yè)的一個(gè)主要內(nèi)容,現(xiàn)在正日益豐富電視觀眾對(duì)各種節(jié)目的體驗(yàn)。由于聲道數(shù)多,以及聲道間同步和元數(shù)據(jù)傳輸要求,電視中心內(nèi)首選的信號(hào)流往往涉及從多種壓縮技術(shù)中采用一種,以壓縮方式傳輸這些多聲道音頻包。
傳統(tǒng)電視處理環(huán)境內(nèi)的信號(hào)處理和編碼設(shè)備最初往往從傳輸和處理一對(duì)或更多對(duì)“標(biāo)準(zhǔn)”(PCM)音頻的概念開(kāi)始。設(shè)計(jì)中必須注意使用像AES3 (1)或其嵌入形式的SMPTE299M (2) 這樣的基于立體聲的數(shù)字傳輸,使立體聲對(duì)的聲道之間保持同步。早期的磁帶機(jī)和基于服務(wù)器的系統(tǒng)通常記錄兩對(duì)立體聲,有時(shí)4對(duì)立體聲,電視中心內(nèi)單獨(dú)的AES音頻聲級(jí)布線往往有兩個(gè)AES通路(兩對(duì)立體聲)。
隨著上世紀(jì)90年代中期電視中心出現(xiàn)多聲道音頻,業(yè)界開(kāi)發(fā)了若干種方案“輕壓縮”多聲道音頻包且在一個(gè)AES3載波上傳送它,以便適應(yīng)布線、磁帶機(jī)和服務(wù)器的兩對(duì)立體聲限制。AES3標(biāo)準(zhǔn)通過(guò)在標(biāo)頭結(jié)構(gòu)內(nèi)包含PCM/非PCM比特預(yù)備這種使用情況,而SMPTE337 (3) 隨后澄清了關(guān)于此使用情況的一些問(wèn)題。這些早期的方案包括Leitch Diamond Audio系統(tǒng)和Dolby E (1)。近期,Dolby E在此技術(shù)的實(shí)際應(yīng)用中幾乎無(wú)所不在。
此外,為把多聲道音頻編碼器連接進(jìn)視頻編碼器,最后一程的多聲道壓縮系統(tǒng)使用了相同的用一個(gè)AES3數(shù)字載波傳輸壓縮音頻的SMPTE337技術(shù)。在這些情況中,音頻碼流處于最后的音頻分配格式,在某些電視環(huán)境中,Dolby Digital (AC-3) 和AAC Multichannel音頻都以這種形式傳輸。此技術(shù)還用于某些在磁帶和服務(wù)器上存儲(chǔ)預(yù)壓縮的分配格式音頻包供以后播放的場(chǎng)合。
在視頻壓縮的情況下,對(duì)于壓縮的傳輸和壓縮的分配環(huán)境,這些預(yù)壓縮音頻信號(hào)使用一種格式特有的標(biāo)準(zhǔn)技術(shù),被打包且復(fù)用進(jìn)一個(gè)MPEG-2傳輸流環(huán)境。在此運(yùn)作中(往往為電視中心的最后遞交點(diǎn)),存在由上游制作部門(mén)處理預(yù)壓縮音頻的錯(cuò)誤/人工產(chǎn)物而導(dǎo)致的缺陷和影響。
這些圍繞電視中心以AES3格式傳輸壓縮音頻的使用情況(無(wú)論是嵌在視頻還是單獨(dú)在AES3上傳輸)有時(shí)是音頻問(wèn)題的起源。本文闡述一些常見(jiàn)的問(wèn)題或此技術(shù)的缺點(diǎn),以及它們的針對(duì)性解決方案。
AES3數(shù)字信號(hào)的簡(jiǎn)單回顧
AES3最初于1985年得到批準(zhǔn),在這期間修改了若干次。這段歷史本身對(duì)電視中心內(nèi)的問(wèn)題起了很大的作用,因?yàn)锳ES-3信號(hào)內(nèi)的控制和狀態(tài)比特的特殊含義和解釋可能根據(jù)一個(gè)設(shè)備支持的標(biāo)準(zhǔn)版本不同而不同。
一般而言,AES3標(biāo)準(zhǔn)以此音頻的取樣率傳輸多對(duì)樣本(本文稱(chēng)為AES幀)。這些AES幀被分成由192個(gè)AES幀組成的AES塊。每個(gè)AES幀內(nèi)為兩個(gè)32位AES子幀(格式如下)的連接。

·報(bào)頭區(qū)為接收機(jī)提供一種信號(hào)鎖定機(jī)制,而在這樣做時(shí)識(shí)別AES塊、AES幀和AES子幀邊界。
·音頻樣本字是實(shí)際值,把此互補(bǔ)二進(jìn)制形式的音頻樣本分為兩部分。當(dāng)使用20位樣本時(shí),末4位可用于其它應(yīng)用(很少用)或設(shè)置為0(常見(jiàn))。
·標(biāo)為“V”的位被稱(chēng)為有效位,其在預(yù)壓縮音頻情況下的含義是本文的主題。AES3-2003文件定義此位為“指示同一子幀內(nèi)的音頻樣本是否適合轉(zhuǎn)換為一個(gè)模擬音頻信號(hào)”。
·標(biāo)為“P”的位為一個(gè)4-31位范圍計(jì)算的偶數(shù)齊偶檢驗(yàn)位。
·標(biāo)為“U”的位可用于用戶應(yīng)用數(shù)據(jù),默認(rèn)為0。
·標(biāo)為“C”的,將來(lái)自AES塊內(nèi)全部類(lèi)似樣本的“C”位合并組成一個(gè)192位(24B)信息塊,稱(chēng)為通道狀態(tài)塊。8頁(yè)AES3-2003文件專(zhuān)門(mén)論述通道狀態(tài)塊的內(nèi)容。注意每個(gè)AES塊有兩個(gè)通道狀態(tài)塊,一個(gè)針對(duì)“第一”子幀樣本,另一個(gè)針對(duì)“第二”子幀樣本。
在通道狀態(tài)塊內(nèi)有若干信息比特,它們影響預(yù)壓縮(非PCM)音頻的處理。
嵌入音頻簡(jiǎn)單回顧
隨著串行數(shù)字視頻的出現(xiàn),獲得的優(yōu)點(diǎn)之一為在此數(shù)字視頻框架內(nèi)嵌入作為“輔助”數(shù)據(jù)的音頻(及其它)信號(hào)。SMPTE272 (4) 規(guī)定標(biāo)清視頻情況下的嵌入音頻,而SMPTE299M規(guī)定高清視頻情況下的嵌入音頻。為清晰起見(jiàn),本文只敘述HD情形。
嵌入音頻結(jié)構(gòu)化為輔助數(shù)據(jù)包。每個(gè)音頻ANC包包含與AES-3數(shù)字信號(hào)(其所有32比特)內(nèi)存在的完全相同的AES子幀信息,而且它主要藉參考AES-3文件定義。4個(gè)通道(兩個(gè)AES幀)被置入每個(gè)音頻ANC包。這對(duì)兩個(gè)AES-3幀內(nèi)音頻信號(hào)之間的關(guān)系提出了一些要求(相同的取樣率、相同的同步/異步模式以及相同的相對(duì)于視頻的相位)。
除了AES幀數(shù)據(jù)外,音頻ANC包還包含一個(gè)CLK字段,它規(guī)定包內(nèi)樣本之間的時(shí)間關(guān)系和視頻幀。在預(yù)壓縮音頻的情況下,這個(gè)CLK信息意義不很大,但依然被此標(biāo)準(zhǔn)要求。
嵌入音頻標(biāo)準(zhǔn)還定義一個(gè)音頻控制包,此包每幀發(fā)送一次,其主要目的為指示音頻幀序列內(nèi)的幀位置(音頻幀序號(hào))。音頻典型取樣率(48kHz)沒(méi)有均勻地劃分某些電視系統(tǒng)的幀率,因此AFN指示序列內(nèi)的位置。音頻控制包還包含關(guān)于哪些嵌入通道活動(dòng)的信息,以及取樣率和通道的同步狀態(tài)。值得注意的是此相同信息在個(gè)別音頻聲道的通道狀態(tài)塊內(nèi)顯示,而傳輸它兩次是一個(gè)潛在的誤差來(lái)源。
工程師可以有多少了解這些相同標(biāo)準(zhǔn)的途徑?
1992年重新頒布并在2003年又頒布的AES3-1985標(biāo)準(zhǔn)清楚地預(yù)見(jiàn)了傳輸嚴(yán)格說(shuō)來(lái)非音頻樣本的數(shù)字信息的AES3接口和格式的用途。SMPTE 337M-2000嘗試澄清電視環(huán)境內(nèi)共同的使用案例。但依然有這些文件的若干“解釋”,它們?cè)谌澜绲碾娨暀C(jī)構(gòu)中流行。
“v”位的意義
以下文件都定義此相同的位。
·在1992年的AES3修訂版中,“v”位定義措詞清楚地稱(chēng)“如果音頻取樣字適合轉(zhuǎn)換為一個(gè)模擬音頻信號(hào),則有效比特為邏輯0,如果不適合,則為邏輯1”。
·SMPTE337M參考AES3-1992,“按照AES3”定義“v”位。
·IEC60958-4定義“v”位含義為“對(duì)于此標(biāo)準(zhǔn),有效位將被用于指示子幀內(nèi)主數(shù)據(jù)段位是否適合于用線性PCM編碼轉(zhuǎn)換為一個(gè)模擬音頻信號(hào)。”不過(guò),IEC60958應(yīng)用域嚴(yán)格地為線性PCM音頻。 [Page]
·IEC60958-3定義“v”位含義為“如果主數(shù)據(jù)段內(nèi)的信息可靠,則有效位為邏輯0,如果不可靠,則為邏輯1。對(duì)有效位無(wú)默認(rèn)狀態(tài)”。此958-3標(biāo)準(zhǔn)定義PCM和非PCM音頻。它接著指出“對(duì)于沒(méi)有采用線性PCM編碼的傳輸,也許可以設(shè)定此位。此舉意在防止在完整的通道狀態(tài)塊收到前非音頻數(shù)據(jù)意外解碼為模擬”。958-3標(biāo)準(zhǔn)附錄A提供“v”位更詳細(xì)的使用歷史,盡管主要為SPDIF的消費(fèi)應(yīng)用。
在AES3上傳輸壓縮音頻時(shí),“v”位應(yīng)設(shè)定或跳過(guò)嗎?最佳的互操作性做法是不管“v”位的值如何,接收器處理數(shù)據(jù),只要PCM/非PCM位指示非PCM數(shù)據(jù)。 通常在壓縮音頻協(xié)議的更高層有檢查和或CRC,它們將真實(shí)地指示任何數(shù)據(jù)誤差。至于專(zhuān)業(yè)環(huán)境內(nèi)所需的行為,兩種情況都在實(shí)地出現(xiàn)。在專(zhuān)業(yè)設(shè)備中,通道狀態(tài)塊內(nèi)的PCM/非PCM位必須正確,而“v”位為有最大的互操作性,應(yīng)指示正確性。在消費(fèi)者接口,最好遵循ICE60958-3附錄A。
“專(zhuān)業(yè)”位
在每個(gè)通道的192位通道狀態(tài)塊內(nèi),字節(jié)0比特0被用于指示數(shù)據(jù)格式是否以AES3文件化(如果此位被設(shè)定為“專(zhuān)業(yè)”),或此數(shù)據(jù)格式是否以IEC 60958-3文件化(如果此位被設(shè)定為“消費(fèi)”)。由于常見(jiàn)的芯片解決方案往往被用于消費(fèi)機(jī)頂盒或?qū)I(yè)接收器,電視廣播中心內(nèi)的數(shù)字音頻信號(hào)在通道狀態(tài)中被標(biāo)為“消費(fèi)”很普遍。常被稱(chēng)為“準(zhǔn)專(zhuān)業(yè)消費(fèi)者”市場(chǎng)類(lèi)別的出現(xiàn)進(jìn)一步模糊這種差別。為了最好的互操作性,專(zhuān)業(yè)設(shè)備應(yīng)該妥善地接收和處理被標(biāo)為“消費(fèi)”的音頻信號(hào),前提是它們確實(shí)符合ICE60958-3標(biāo)準(zhǔn)。值得特別指出的是當(dāng)發(fā)送設(shè)備設(shè)定“專(zhuān)業(yè)”位時(shí),應(yīng)該計(jì)算和發(fā)送通道狀態(tài)塊的CRC字節(jié),因?yàn)榻邮赵O(shè)備將可能認(rèn)為它是正確的。如果此比特被設(shè)為“消費(fèi)”,則CRC字段應(yīng)該被發(fā)射機(jī)設(shè)置為0,并被接收器忽略。
“非PCM位”
在消費(fèi)和專(zhuān)業(yè)版的通道狀態(tài)塊內(nèi),字節(jié)0比特1指示通道內(nèi)樣本是“線性PCM樣本”,還是別的東西。在本文的應(yīng)用中,它始終是“別的東西”。此比特準(zhǔn)確無(wú)誤是最重要的,搞錯(cuò)往往以毀滅告終。此領(lǐng)域內(nèi)大多數(shù)設(shè)備內(nèi)置取樣率轉(zhuǎn)換器或其它音頻處理(如增益控制)。未能設(shè)定此位將導(dǎo)致這些樣本被處理,破壞它們的非PCM意義。這一般導(dǎo)致非常嘈雜的“機(jī)關(guān)槍”噪聲。
數(shù)據(jù)—塊—序號(hào)(DBN)字段
在SMPTE 299M-2004嵌入音頻標(biāo)準(zhǔn)中,規(guī)定音頻數(shù)據(jù)包有一個(gè)與SMPTE 291M有關(guān)的DBN字段。SMPTE 291M定義此字段,而嵌入音頻包為T(mén)ype-1包,由此該術(shù)語(yǔ)被用于SMPTE-291中。開(kāi)啟短句“要求一個(gè)連續(xù)性指示”,此DBN字段可以有一或兩個(gè)辦法做到這點(diǎn)。設(shè)定DBN的8比特內(nèi)容為0是有效的(如果你認(rèn)為不需要一個(gè)連續(xù)性指示)。把一個(gè)1-255的增值模式置入DBN的8比特內(nèi)容也是有效的,不過(guò),如果每幀重新開(kāi)始連續(xù)計(jì)數(shù),這些標(biāo)準(zhǔn)并不絕對(duì)清晰,或如果有一個(gè)DBN零和DBN增值(如可能來(lái)自?xún)蓚€(gè)有不同方案的發(fā)送器之間的設(shè)施內(nèi)的交換機(jī))的混合,怎么去做也不清晰。最安全的方法是發(fā)送一個(gè)零DBN計(jì)數(shù)值,指示為了決定性的連續(xù)目的,此DBN是閑置的。
Dolby E簡(jiǎn)要回顧
Dolby E系統(tǒng)設(shè)計(jì)用于電視存儲(chǔ)、播放、制作和分配的特殊環(huán)境。Dolby E系統(tǒng)內(nèi)一切都與視頻信號(hào)的幀頻同步工作;對(duì)應(yīng)視頻內(nèi)容某一幀的所有音頻樣本(跨越最多8個(gè)單聲聲道)以及它們的元數(shù)據(jù)被壓縮為Dolby E的一“幀”。為明確主題,討論25Hz和29.97Hz的情形。在59.94Hz逐行系統(tǒng)或50Hz逐行系統(tǒng)中,一“幀對(duì)”視頻幀的音頻樣本被合并為一個(gè)Dolby E幀,然后以相應(yīng)視頻幀的一半速率處理此幀。
此Dolby E數(shù)據(jù)“幀”在非PCM模式中以SMPTE337內(nèi)描述的“數(shù)據(jù)串”方式,采用AES3信號(hào)的取樣比特被傳輸。除了SMPTE337規(guī)定的以外,這些Dolby E數(shù)據(jù)串與Dolby E碼流的數(shù)據(jù)結(jié)構(gòu)一致,而且被同步,因而它們與視頻幀時(shí)間對(duì)齊,留下一個(gè)保護(hù)帶用于對(duì)準(zhǔn),如圖1所示。

通過(guò)對(duì)準(zhǔn)Dolby E碼流結(jié)構(gòu)、數(shù)據(jù)串和視頻幀,可以在視頻切換點(diǎn)進(jìn)行不同視頻信號(hào)之間的切換,并且有Dolby E音頻的連續(xù)性。如果Dolby E編碼器沒(méi)有與視頻正確相關(guān)且相位沒(méi)有完全對(duì)齊無(wú)法確保保護(hù)帶在正確的位置,則此切換行為將不能獲得預(yù)期效果。若干大廠商提供測(cè)量和確認(rèn)此對(duì)準(zhǔn)的測(cè)試設(shè)備。B&P
(未完待續(xù))