
本文摘自Extron公司《AV System Design 2011》夏季刊
訂閱網址:www.extron.com/avsd
每天,基于IP技術的視頻都在我們的工作和生活中廣泛應用。隨著網絡的日益擴展和流媒體技術的逐漸成熟,我們可以通過視頻獲得更多的信息,更好地進行溝通和交流。在視音頻行業,像視頻會議這樣的流媒體應用多年來已經很普遍了,新的應用也在不斷涌現,因為相對于現有的應用來說流媒體技術具有更新的功能和更經濟的成本。隨著流媒體產品的不斷增多,專業視音頻工作者需要從浩如煙海的產品中挑選出適合自己應用的流媒體產品和壓縮編解碼器,這是一個很大的挑戰。
“codec”這個詞有多種含義。它是編碼器和解碼器這兩個詞的組合,用于概括所有具有這一功能的硬件或軟件產品,比如視頻會議編解碼器,可以同時對視頻進行編解碼操作。它也可以用來描述模擬-數字-模擬的轉換處理。當我們仔細研究各種用于視音頻流媒體的編解碼器,再結合這一領域內技術的飛速發展,就會發現很多問題,比如:
● 為什么會有這么多不同的編解碼器?
● 這些編解碼器各自優劣?
● 有沒有一種編解碼器能夠適用于所有的應用?
● 這些編解碼器在技術性能上有什么不同?分別適用于哪種應用環境?
● 市面上有標準編解碼器和專用編解碼器兩種,該如何選擇?
消費級和企業級應用
家用設備或個人電腦的使用經驗會影響到人們對企業應用的期望。我們經常會聽到客戶抱怨說為什么在家里用Skype很好,但在公司里用類似的通信工具開視頻會議時就很差。我曾經聽到有人說:“為什么我在家里和朋友Skype的時候,聲音和畫面都很清楚,但是在用了更加昂貴的設備的辦公室里,畫面和聲音卻這么差?”
造成這一結果的原因有很多。首先,這個人的辦公室里使用的可能是一套陳舊的標清視頻會議系統。這種系統是用很低的帶寬傳輸了一個低分辨率的信號,顯示在大尺寸的平板顯示器上。而在家里,Skype的應用窗口在中等大小的桌面顯示器上只占了一小塊。我們感覺到質量更好,是因為視頻以更高的像素密度顯示在應用窗口中,從而與流媒體的分辨率相匹配。如果在更大的平板顯示器上顯示Skype視頻,它也會變得顆粒化。流媒體質量標準并不固定,重要的是要為自己的應用找到“夠好”的質量。不顧具體情況的話,客戶就會根據家里的經驗提高在辦公室的期望。
此外,個人電腦上的應用并不會支持關鍵任務所需的可靠性,或提供企業級設備所必須提供的安全性。消費級和企業級解決方案所要面對的需求是不一樣的。
快速發展的平板電腦和手機上的視頻通訊可能擴大這一矛盾,因為用戶希望能夠用移動計算設備和智能手機方便地連接專業視音頻系統。
編解碼標準
國際或行業標準組織已經開發了很多編解碼標準,獨立組織也開發了一些可以用于開放和封閉的應用環境中的編解碼器。還有些獨立開發的編解碼器,則需要從專用的轉換成標準的形式。
最常見的編解碼標準都來自于標準組織。聯合圖像專家組——JPEG開發了用于靜止圖像壓縮的JPEG和JPEG2000,同時在運動圖像中也得到了應用。最新的JPEG2000標準已經成為了數字影院行業從硬盤播放運動圖像的壓縮標準。
國際標準化組織(ISO)中的運動圖像專家組,或MPEG,開發了第一種MPEG-1編解碼標準。隨后的MPEG-2提高了圖像的質量,并且能夠支持高清視頻。MPEG-2廣泛應用于DVD、有線電視和衛星分配以及高品質廣播應用領域。
國際電信聯盟——ITU建議采用H.323視音頻通信協議,其中包括H.261、H.263以及H.264,這些視頻編解碼主要適用于在通信線路,如ISDN、T1、E1或網絡上的互動式視頻會議應用。
ITU和ISO共同組成了聯合視頻組織——JVT,并開發了H.264、MPEG-4第10部分和高級視頻編解碼(AVC)。今天我們通常采用H.264,在新的流媒體硬件編碼器中它已經取代了MPEG-2成為最常用的編解碼方式。
在廣播電視行業,電影電視工程師協會——SMPTE和歐洲廣播聯盟——EBU早就為廣播電視、節目交換以及傳輸和制作系統的交互規定了平臺。他們為各自的行業推薦并定義了標準,這也延伸到了其他行業。
微軟和松下都針對特定的應用自主研發了視頻編解碼器。微軟的VC-1大大提高了對隔行掃描視頻進行壓縮的效率和質量,因此吸引了隔行掃描視頻廣播行業的興趣。VC-1開始是一種專用的編解碼器,但隨后SMPTE把它作為了一個標準。微軟在WMV3、WMVA中采用了VC-1編解碼標準,在Windows媒體播放器中采用了WVC1。松下的AVC-Intra編解碼器完全符合H.264 MPEG-4/AVC標準和SMPTE的工業標準。它針對的是電子新聞采集領域所使用的典型的10比特錄像機,當然也可以用于存儲和歸檔應用中。該技術的發展與松下生產的相關設備如攝像機、錄像機和攝錄一體機的性能密切相關。
正如你所看到的那樣,這兩家公司在各自的目標應用內分別研發了編解碼器。VC-1一開始是專用的,而AVC-Intra是在標準上進行了進一步研發。這些現實中的例子證明,應用需求推動了編解碼技術的發展。
開放和封閉的環境
許多流媒體應用的編解碼適用于封閉的網絡系統,或在終端通過硬件或軟件控制的管理性連接。硬件編解碼解決方案要使用HD-SDI、DVI或其他格式的電子信號接口來傳輸流媒體。如果使用軟件解碼的方式,可以在封閉的系統中安裝管理插件。在這里,視音頻集成商最初關注的是在編碼器輸入端和解碼器輸出端要有匹配的信號格式,還要建立并維護所需要的通信線路或網絡連接。除此以外,還要評估每一個項目的編解碼的質量、比特率要求和技術性能。
開放的網絡環境,如互聯網甚至大型企業,會有大量的潛在終端。在每一個潛在終端都使用解碼硬件是不現實的,在每個終端上都安裝軟件也不太可能。如果我們考慮將流媒體傳送到未經管理的PC或是解碼器上,那么多媒體轉換成的流媒體內容應該是一段視頻比特流。終端必須支持兼容視頻比特流的編解碼、協議或是應用程序。[page]
計算機環境中的編解碼
專業視音頻系統把以下三種不同的環境多媒體集中起來進行共同管理:1) 電信視頻會議系統;2) 基于廣播標準的視頻;3) 來源于PC的多媒體。PC環境成為了編解碼技術領域中的一個變量。
這個環境中的標準經常會隨著市場的運行和自身的優點、弱點進行改變,商業組織或商業聯盟也會不斷建立標準。最具實力的公司事實上就成為了標準。微軟、蘋果、Adobe、Google等行業巨頭通過不同的產品和技術為他們的客戶提供服務,作為商業組織,他們投資研發技術,設立競爭壁壘,從而實現他們的經濟目的。
在PC流媒體環境中,除了編解碼之外,必須充分考慮那些變量,包括承載格式、傳輸方式、媒體播放器、數字版權管理、操作系統以及計算機設備。
現在,絕大部分的在線視頻使用了Adobe公司的Flash播放器。它采用專有的承載格式——Flash視頻,作為插件安裝在PC上,就可以通過網頁瀏覽器觀看視頻。無處不在的Flash為Adobe公司的產品帶來了極大的競爭力,但PC環境下眾多的開發者們還是寧愿選擇開源技術,而不是為了符合操作需求而使用Flash。
就iPhone和iPod Touch上安裝的蘋果iOS操作系統中使用Flash播放器的問題,Adobe和Apple公司之間的公開斗爭已經引起了公眾的廣泛關注。Adobe公司設計了一款跨平臺的編程工具,并開發了將Flash應用轉換為本地iPhone應用程序的軟件。不過Apple公司更改了它的開發協議,使得基于Flash的應用軟件失效。而Adobe又對Apple的HTTP在線流媒體增加了Flash媒體服務,并在2011年全美廣播工作者聯合會展上推出了這一功能,解決了Apple在自身平臺上對它所作的限制。Apple和Adobe都希望通過確立自己的競爭優勢而獲得更大的經濟利益。像這樣的商業競爭給用戶在軟件平臺、應用程序和終端設備上帶來了風險。
關于最新的網頁瀏覽器標準HTML5中編解碼的使用,去年也有大量報道。HTML5是第一個把視頻像文字和圖片一樣內嵌到網頁瀏覽和流程中的標準。萬維網聯合組織的HTML工作組可能不同意在HTML5內使用通用的編解碼方式。理想情況下,工作組選擇一個編解碼器就可以解決所有的終端應用,但這最終沒有實現。他們選擇了一系列的編解碼方式。最開始選用了由Xiph.Org基金會開發的Theora和Ogg技術,而且它是免版權稅的。微軟青睞于H.264,因為它具有強大的壓縮能力。而像Mozilla和Google這些公司則由于許可證的問題不同意使用H.264。
2010年,Google收購了開發出WebM格式的On2科技公司。這種格式采用了VP8編解碼標準,Google把它用在自家的Chrome瀏覽器上。Mozilla選擇把WebM用到Firefox中,就像他們以前在Opera中使用的那樣。VP8在YouTube上也有了更多的應用。
2010年,微軟發布了支持H.264的Internet Explorer 9,以及支持Chrome上使用擴展HTML5的新版Windows媒體播放器,這樣Windows 7 Chrome用戶就可以觀看H.264編碼的內容。這意味著系統供應商可以為用戶使用的瀏覽器提供H.264插件。同樣的,Google也可以提供WebM插件。最近,也就是2011年5月,微軟一直致力于推廣H.264,他們還收購了使用VP8編解碼的Skype。
幾乎所有傳送到終端用戶的數字視頻都是一個端到端的解決方案。對視頻分發編解碼標準的關注主要集中在通過英特網、有線電視、衛星和其他物理介質進行連接的內容發展和傳輸上。即使視頻內容的編碼方式是基于標準的,也可能會采用專用的承載格式、傳輸協議、媒體播放器或數字版權管理計劃。為了觀看基于標準的視頻,終端設備必須使用安裝了插件的瀏覽器,也可以使用一個嵌入了小程序的應用程序或其他媒體輔助設備。在這里,專用化影響了PC行業,阻礙了與基于標準編解碼視頻之間的互通性。
PC業巨頭之間的標準之爭產生了許多有趣的新聞;但是這種對競爭優勢的追求阻礙了單個編解碼器的使用,使網絡流媒體的互通性更加復雜化。這不但顯示出視頻流在PC和其他設備上受歡迎程度,還揭示了競爭壁壘對未來的盈利是多么關鍵。
再次討論關于“標準”這個話題
標準是由行業、國家或國際組織所建立的,也可以由非官方的聯盟或組織建立。標準在通信技術上必須要有互通性,特別是一對多或多對多的應用中。例如以下這些標準:
● IEEE 100BaseT——以太網絡接口標準
● NTSC或ATSC——視頻廣播標準
● ITU H.323——視頻會議標準
采用了這些標準的產品能夠真正地實現互通性。把NTSC信號通過一個標記為NTSC的BNC插頭接到顯示器上,你就能得到視頻圖像。這同樣適用于以太網通訊和H.323視頻會議標準。
編解碼標準主要致力于規范數據格式和解碼,在具體應用中讓不同產品自己選擇更有效率或更簡潔的編碼。標準不是要確定質量,而是促進產品之間的互通性。不過研究團隊要找到“最佳解決方案”并把它定為標準。
如前文所述,視音頻行業要遵循廣播電視標準,但在連接、分辨率、信號格式、數字版權管理和解密方式等方面還會用到計算機視頻和消費級視頻設備,這些設備可能遵循的是廠商自己的規定或是事實標準。由于這些不是“批準”的標準,所以這些接口可能不一定符合“批準”的標準所規定的規格。對于視音頻廠商和集成商來說,集成這種設備是需要面對的一種持續不斷的挑戰。
基于標準的編解碼器因為采用的是通用技術,所以更容易降低成本。例如,使用MPEG-2和H.264編解碼技術的廠商越多,競爭越激烈,就會有更多的產品面世。使用標準的廣大用戶一起,也會推進和完善技術性能。不過,使用標準的編解碼器并不能確保產品之間的互通性。流媒體設備的處理能力、傳輸協議或是承載格式都有可能是專用的。產品之間的兼容性需要進行實際的審核和驗證。
在視頻必須以通用格式的數字文件或比特流的形式進行傳輸的一對多或多對多的傳輸模式或制作流程應用程序中,互通性對開放的、無管理的終端是非常有用的,其結論是自然會選擇一個標準。不過由于技術或性能的原因,對于具體的應用來說,只是因為它是“標準”就隨意地選擇一種常用的編解碼器可能并不是一個最佳的選擇。
圖像轉換和編解碼
視頻編解碼主要有兩種轉換方式。離散余弦轉換——DCT和離散小波轉換——DWT。這兩種轉換方式把視頻數據從空間域轉換到頻域,能夠更方便地壓縮圖像數據。每種轉換方式都有各自的優缺點。以前常用的是DCT,在開發它的時候計算機的處理能力還很有限,而DCT所消耗的處理能力極少,所以當時是最合適的。DWT已經使用在許多應用中,但隨著JPEG2000壓縮標準的出現會獲得更廣泛的使用。
DCT在時域壓縮的編解碼中得到廣泛應用,通過圖像組 (GOP) 處理數據。這包含了在網絡上的流媒體視頻所使用的編解碼標準,像H.264、Theora和VP8。這些編解碼標準可以使高清視頻的比特率低于10Mb/s甚至5Mb/s,而標清視頻或更低分辨率,比如176×144的常用標準化格式(QCIF),比特率則低于1Mb/s。另一方面,DWT提供了極高的靜止畫面壓縮效率,因此隨著靜止畫面壓縮比的增加,能夠提供連續而優美的圖像輸出。在JPEG2000中,這對網絡上的高清視頻流是非常有用的,因為它能夠支持100Mb/s甚至更高的比特率,同時還能保持很好的圖像質量和低于100ms的編碼至解碼延時。
例外情況如下:1) 4個H.264 High Profiles使用了內部壓縮,可以用較低的延時提供與JPEG2000相似的畫面質量;2) Dirac編解碼技術,是對圖像組方案上進行時域壓縮,3) Extron的PURE3編解碼技術,采用了DWT,卻少有的能夠提供時域壓縮能力,在具體應用中可以把高清計算機視頻的比特率從10Mb/s降低到1Mb/s。
專用編解碼器
專用編解碼器普遍用在工業和消費級應用中。推動專用編解碼技術發展的情況如下:
1、開發商或廠商發現現有標準無法滿足用戶的需求。就需要投資開發新的編解碼器以滿足相應的需求。這一情況更可能發生在封閉的應用中。
2、一個公司擁有廣大的用戶群,開發自己的編解碼器、承載格式或是播放軟件,從而可以管理傳輸到終端的質量。這一情況主要存在于擁有大量用戶的情況中,例如PC。
3、開發商或廠商研發了一種編解碼器,就可以用替代產品來獲取競爭優勢或打破競爭壁壘。
4、公司自主開發編解碼器,還可以避免專利的許可費和法律風險。
對于企業級應用,可以考慮采用專用編解碼器來管理終端。要規劃系統的傳輸接口、終端、預算和擴展性。具體的性能和質量要求可能基于比特率,或是特定網絡的糾錯能力,也可能是基于支持特定的輸入輸出信號格式、分辨率或圖像質量,還可能是基于非常低的編解碼延時,例如低于100ms。
在企業級應用中,用專用視頻編解碼技術設計的專有硬件設備能夠提供更好的性能,因為基于標準的視頻編解碼器融合了眾多廠商的知識產權和技術。專用的編碼算法和專有硬件通常可以優化,并根據特定應用的特殊需求進行調整。基于標準的硬件和軟件應用程序可以固定或預先進行配置,以傳送特定的視頻內容,比如在低于5Mb/s的帶寬下傳送娛樂節目或電信視頻會議。這些低帶寬解決方案在圖像質量和低延時需求上可能不適合企業級應用,像遠程視頻分配鏈接、遠程醫療、指揮和控制、監視或仿真環境。
專用編解碼器還可以提供更高的安全性,因為公眾不太容易接觸到這些技術平臺。所有通信應用的安全基礎都是物理安全性、可靠的通信建筑和網絡策略以及加密技術。專用編解碼器的使用還能夠提供額外的保護,因為其他人無法輕易地訪問此編解碼器。
使用開放式標準的漏洞有一個現成的例子,在2008年,伊拉克武裝分子使用SkyGrabber一款公開售價26美元的衛星監視軟件,攔截并監視了美國無人偵察機所拍攝的視頻。而專用編解碼器會大大增強武裝分子這一行為的難度。
網絡和用戶環境
考慮你的流媒體產品所處的網絡環境是很重要的。讓我們來看一下這三種網絡環境:
● 專用網絡——專用網絡的設計和配置能夠支持流媒體的傳送需求。它們的性能可以進行測量和管理。如果網絡架構是用于共享用戶數據、語音和視頻,就更要注意帶寬的使用。
● 公共網絡——流媒體在互聯網上傳輸會碰到許多的挑戰,因為它是一個公共的共享網絡。服務質量——QoS以及終端帶寬限制了流媒體應用的類型。安全性也是一個問題。
● 虛擬專用網絡(VPN)——VPN在連接英特網時會進行加密,因此能提供更高的安全性。
專用的、可管理的網絡上可以使用需要50Mb/s或更高帶寬的編解碼器。公共網絡或共享專用網絡通常只有較低的帶寬,比特率必須低于5Mb/s,越低越好。英特網上對服務質量(QoS)的保障更少,所以可能需要設計糾錯系統或傳輸和流媒體協議來達到可靠的性能。
決定使用標準的還是專用的編解碼器?
前文討論了許多問題,包括針對不同應用的各種專用和標準編解碼器、開放和封閉的系統、不同的網絡環境以及采用不同轉換方式的編解碼器的總體性能。有些流媒體應用需要向顯示系統或制作系統傳送電子信號,而其他應用則需要直接向開放系統中的PC或其它硬件解碼器傳送視頻比特流。最后,PC行業受到了幾個行業巨頭的控制。雖然對編解碼技術很不利,但我們知道:
● 有許多種編解碼器可以使用,其中有一些針對的是特定應用和需求
● 某些應用需要互通性,因為要用編解碼器進行傳輸和媒體交換,這已經被官方標準機構寫入標準中
● 視音頻應用必須要提供媒體來源的解決方案,因為它們經常不提供標準的分辨率、接口和互通性
● 標準的使用,可以支持在線流媒體或制作流程中的眾多終端的互通性和數字媒體傳輸
● 專用的解決方案可以提供更好的性能,增強安全性
● 許多編解碼器和專用的承載格式的插件和轉換工具提供了不同解碼設備之間的兼容性
以下是選擇編解碼器的準則。它包括:1)用戶和系統環境;2)交換格式;3)傳輸模式;4)終端;5)性能。這個準則不是絕對的,但它在某種程度上是選擇編解碼器的一個指南,可以避免簡單化的思維、過度的營銷宣傳和行業市場的派別之爭。
最明智的做法是——保持跟進。ITU和ISO的聯合視頻工作組目前正在研究高效視頻編碼標準——HEVC來接替H.264。目標是將較低復雜性應用中的H.264的比特率降低一半。希望未來對不同的編解碼器能夠繼續討論、編寫白皮書、進行升級。消費級和企業級流媒體應用的飛速發展和提高會帶來持續的變化,并研發出新的編解碼器。