在我們討論如MPEG-2和H.264這樣的視頻壓縮時,我們往往考慮的是視頻方面,對音頻考慮不多。音頻的確很重要,但現實就是這樣。
由于對超越現用于藍光盤和許多攝錄一體機的MPEG-4/H.264壓縮有很強烈的推力,我們應花一點時間考慮下一代視頻編碼的音頻特性。最可能廣泛采用的下一代編解碼是HEVC(高效率視頻編碼),或H.265。記住這是一種視頻編解碼,不是音頻編解碼。將配套HEVC的音頻編碼正由不同于HEVC/H.265的工作團隊開發。
谷歌也開發了一個競爭的壓縮標準VP9,它將內建于許多網絡瀏覽器內。VP無特許權使用費,谷歌對VP9的愿景是比HEVC/H.265,它在編碼效率和圖像質量方面有更好的性能。盡管如此,H.265看來在未來數年將是專業和廣播視頻選擇的編碼標準,盡管它有相關的特許權使用費。
還有另一種下一代視頻編解碼即將浮現,它稱為Daala,正由Xiph.Org基金會和Mozilla公司開發。Xiph.Org的創立者表示Daala性能應超越HEVC和VP9一代,但2015年預計不會發布。有趣的是,Xiph.Org基金會是FLAC(自由無損音頻編解碼)的創造者。FLAC因其音頻性能頗受好評。
兩倍效率
從視頻觀點來看,H.265效率是H.264的兩倍,而H.264效率是MPEG-2的兩倍左右。換句話說,用MPEG-2編碼視頻流要求20Mb/s,用H.264和H.265只需10Mb/和5Mb/s左右。這有點過于簡單化,但為一個有用的經驗法則。

MPEG-2引導我們的大多數認識了MP3音頻編碼。與MPEG-1壓縮一起在上世紀90年代推出,MP3代表MPEG音頻第三層。它成為了一個流行的音頻壓縮標準,但同時使用的還有很多。與母視頻壓縮標準一樣,MP3為一種有損壓縮,意味著為達到其壓縮,它改變音頻,并且它們一旦被壓縮,這些改變無法恢復。
MP3具有廣泛的影響最終音頻質量的設置,包括取樣率和碼率。主流MP3可在32、44.1和48kHz取樣,并能以56-384kb/s碼率編碼。在128kb/s和44.1kHz取樣,一個MP3文件大小是一個不壓縮CD錄音的9.1%左右。在320kb/s碼率編碼MP3文件,產生的碼流大小是一個不壓縮CD錄音的23%。
高級音頻編碼(AAC)在MP3后開發,并利用了從該格式吸收的東西。AAC在相同碼率普遍提供更好的音質。AAC還有一個成為高效率高級音頻編碼(HE-AAC)的分支,它被用于如DVB-H和ATSC-M/H等的移動電視標準。與MP3類似,AAC也是一直有損壓縮格式,并且有一系列類似于MP3的設置。
杜比數字和AC-3是同一音頻處理格式的兩個名稱。AC-3由杜比實驗室開發,有時被稱為“音頻編解碼三”或“高級編解碼三”。所有形式的AC-3都支持環繞聲,最初版本傳載5.1聲道,后來的杜比數字+處理7.1聲道。杜比數字+增強版E-AC-3能夠傳載最多13.1聲道。更高編碼效率的E-AC-3意味著它在一個256kb/s碼流中能夠提供不錯的5.1聲道音頻。
下一代音頻格式
與HEVC/H.265有關的主要音頻編碼格式是MPEG-H和AC-3,也可能包括之后的其它編解碼。MPEG-H可認為是“增強版AAC”,去年ATSC宣布MPEG-H 3D音頻為提議用于ATSC 3.0音頻系統的三種標準之一。在其最簡單的形式,MPEG-H將支持8聲道音頻。它有其它許多特性,包括提供響度元數據的能力。

Dolby AC-4同樣是從AC-3演變而來的非常高級的編解碼。相比AC-3,AC-4提高廣播節目的壓縮效率約50%。AC-4已由歐洲電信標準協會標準化且被英國標準組織DVB項目采用。此標準具有對對白增強、智能響度和高級動態范圍控制的原生支持,以及對多語種和描述范圍的更有效支持。
這些音頻編解碼與HEVC的相互作用依然在發展中,并將成為美國最終的ATSC標準的一部分。在最近的ATSC訓練營,NBC的Jim Starzynski演示了MPEG-H的現狀以及未來的預期。
與視頻編解碼一樣,音頻編解碼在把音頻壓縮為較小碼流時正更高效。這將使未來的廣播節目編解碼提供更多音頻聲道,并且為廣播機構提供數量與質量達成折衷的更多選擇。