H.265重新利用了H.264中定義的很多概念。兩者都是基于塊的視頻編碼技術(shù),所以它們有著相同的根源和相近的編碼方式,包括:
1、以宏塊來劃分圖片,并最終以塊來細(xì)分。
2、使用幀內(nèi)壓縮技術(shù)減少空間冗余。
3、使用幀內(nèi)壓縮技術(shù)減少時間冗余(運(yùn)動估計和補(bǔ)償)。
4、使用轉(zhuǎn)換和量化來進(jìn)行殘留數(shù)據(jù)壓縮。
5、使用熵編碼減少殘留和運(yùn)動矢量傳輸和信號發(fā)送中的最后冗余。
事實上,視頻編解碼從MPEG-1誕生至今都沒有根本性改進(jìn),H.265也只是H.264在一些關(guān)鍵性能上的更強(qiáng)進(jìn)化以及簡單化。
當(dāng)你考慮“只是在普通互聯(lián)網(wǎng)上傳輸4K內(nèi)容,還是要實現(xiàn)最好的圖像質(zhì)量”之時,就要先厘清“更多的壓縮”和“更好的壓縮”這兩個概念。如果只是更多的壓縮,4K和超高清不一定要保證比今天的1080p或HD做到更好的圖片質(zhì)量。更好的壓縮則意味著更聰明的壓縮,面對同樣的原始素材,更好的壓縮會以更好的方式,在不犧牲質(zhì)量的情況下令數(shù)據(jù)量減少。更多的壓縮很容易,而更好的壓縮需要更多的思考和更好的技術(shù),通過更智能的算法來處理圖像,在維持質(zhì)量的同時保持更低的比特率,這正是H.265所要做的。
如何實現(xiàn)更好的壓縮,舉例來講,我們通常會發(fā)現(xiàn)在很多的圖像素材里,如視像會議或者電影的很多場景中,每一幀上的大部分內(nèi)容并沒有改變太多,視像會議中一般只有講話者的頭在動(甚至只有嘴唇在動),而背景一般是不動的,在這種情況下,我們的做法不是對每一幀的每一個像素編碼,而是對最初的幀編碼,然后僅對發(fā)生改變的部分進(jìn)行編碼。
圖像分區(qū)
轉(zhuǎn)換尺寸
預(yù)測單元
幀內(nèi)預(yù)測:H.265有35個不同的幀內(nèi)預(yù)測模式(包括9個AVC里已有的),包括DC模式、平面(Planar)模式和33個方向的模式。幀內(nèi)預(yù)測可以遵循轉(zhuǎn)換單元的分割樹,所以預(yù)測模式可以應(yīng)用于4×4、8×8、16×16和32×32的轉(zhuǎn)換單元。
幀間預(yù)測:針對運(yùn)動向量預(yù)測,H.265有兩個參考表:L0和L1。每一個都擁有16個參照項,但是唯一圖片的最大數(shù)量是8。H.265運(yùn)動估計要比H.264更加復(fù)雜。它使用列表索引,有兩個主要的預(yù)測模式:合并和高級運(yùn)動向量。
去塊化
采樣點自適應(yīng)偏移(Sample Adaptive Offset)
去塊之后還有第二個可選的濾波器,叫做采樣點自適應(yīng)偏移。它類似于去塊濾波器,應(yīng)用在預(yù)測循環(huán)里,結(jié)果存儲在參考幀列表里。這個濾波器的目標(biāo)是修訂錯誤預(yù)測、編碼漂移等,并應(yīng)用自適應(yīng)進(jìn)行偏移。
并行處理
由于HEVC的解碼要比AVC復(fù)雜很多,所以一些技術(shù)已經(jīng)允許實現(xiàn)并行解碼。最重要的為拼貼和波前(Tiles and Wavefront)。圖像被分成樹編碼單元的矩形網(wǎng)格(Tiles)。當(dāng)前芯片架構(gòu)已經(jīng)從單核性能逐漸往多核并行方向發(fā)展,因此為了適應(yīng)并行化程度非常高的芯片實現(xiàn), H.265 引入了很多并行運(yùn)算的優(yōu)化思路。
總而言之,HEVC將傳統(tǒng)基于塊的視頻編碼模式推向更高的效率水平,總結(jié)一下就是:
-可變量的尺寸轉(zhuǎn)換(從4×4 到32×32)。
-四叉樹結(jié)構(gòu)的預(yù)測區(qū)域(從64×64到4×4)。
-基于候選清單的運(yùn)動向量預(yù)測。
-多種幀內(nèi)預(yù)測模式。
-更精準(zhǔn)的運(yùn)動補(bǔ)償濾波器。
-優(yōu)化的去塊、采樣點自適應(yīng)偏移濾波器等。
與之前從H.261到H.264的其他標(biāo)準(zhǔn)相比,H.265的顯著改善不僅表現(xiàn)在幀間壓縮領(lǐng)域,還表現(xiàn)在幀內(nèi)壓縮方面。由于可變量的尺寸轉(zhuǎn)換,H.265在塊壓縮方面有很大的改善,但是增加壓縮效率的同時也帶來了一些新挑戰(zhàn)。
視頻編碼是一個復(fù)雜的問題,對于內(nèi)容的依賴性很高。眾所周知,有靜態(tài)背景的和高亮的低動態(tài)場景可以比高動態(tài)、黑場的圖片進(jìn)行更多的壓縮。所以對于像H.264這樣的現(xiàn)代化編解碼器來說首要解決的是最困難的場景/情境。例如,有細(xì)節(jié)的關(guān)鍵幀、高動態(tài)的“勾邊(crisp)”圖像、黑暗區(qū)域的慢動態(tài)、噪聲/紋理等。
H.265在幀內(nèi)編碼方面效率更高,所以細(xì)節(jié)區(qū)域可以被編碼得更好,在平滑區(qū)域和漸變區(qū)域也是如此。與H.264相比,H.265的運(yùn)動估計和壓縮更有效,而且在偽影出現(xiàn)前可以在更低的比特率上操作。好消息是,H.265產(chǎn)生的偽影更加“平滑”,質(zhì)量的降低也非常協(xié)調(diào),即便對非常激進(jìn)的分辨率/比特率編碼時,也觀感良好。
然而,正如硬幣的兩面,當(dāng)處理黑暗區(qū)域的慢動態(tài)和噪聲/紋理兩種問題時,H.265的優(yōu)勢也會變成弱勢。黑暗區(qū)域和噪聲/紋理要求更精確的高頻保留和更小的色階變化。這通常被稱之為編碼的心理優(yōu)化。
由于H.264使用小的轉(zhuǎn)換,可以輕松將量化誤差變成特征/細(xì)節(jié),雖然與原始內(nèi)容不同,但是感覺上“近似”。接近原生頻率范圍的誤差生成可以通過小的邊界轉(zhuǎn)換來阻止,因此也更加可控。而更大轉(zhuǎn)換的H.265要使用這種方式則會更加復(fù)雜。
H.265編碼視頻的存儲依然是個問題,即使藍(lán)光光盤協(xié)會正在尋求一個能夠在藍(lán)光光盤上存儲4K視頻的解決方案。只有至少達(dá)到100GB容量的光碟才能存儲H.264編碼的藍(lán)光4K電影。而另一方面,即使H.265編碼和芯片部件已經(jīng)準(zhǔn)備就緒,但是仍然缺少支持4K內(nèi)容的存儲和重放解決方案,并且能夠兼容現(xiàn)有的藍(lán)光標(biāo)準(zhǔn)。這也是H.265發(fā)展中的一個主要挑戰(zhàn)。
當(dāng)你考慮“只是在普通互聯(lián)網(wǎng)上傳輸4K內(nèi)容,還是要實現(xiàn)最好的圖像質(zhì)量”之時,就要先厘清“更多的壓縮”和“更好的壓縮”這兩個概念。如果只是更多的壓縮,4K和超高清不一定要保證比今天的1080p或HD做到更好的圖片質(zhì)量。更好的壓縮則意味著更聰明的壓縮,面對同樣的原始素材,更好的壓縮會以更好的方式,在不犧牲質(zhì)量的情況下令數(shù)據(jù)量減少。更多的壓縮很容易,而更好的壓縮需要更多的思考和更好的技術(shù),通過更智能的算法來處理圖像,在維持質(zhì)量的同時保持更低的比特率,這正是H.265所要做的。
如何實現(xiàn)更好的壓縮,舉例來講,我們通常會發(fā)現(xiàn)在很多的圖像素材里,如視像會議或者電影的很多場景中,每一幀上的大部分內(nèi)容并沒有改變太多,視像會議中一般只有講話者的頭在動(甚至只有嘴唇在動),而背景一般是不動的,在這種情況下,我們的做法不是對每一幀的每一個像素編碼,而是對最初的幀編碼,然后僅對發(fā)生改變的部分進(jìn)行編碼。
在H.265大步向前的同時,谷歌VP8的繼任者VP9也已推出,同樣在VP8的基礎(chǔ)上號稱編碼效率提高50%,支持8K內(nèi)容。VP9是一個開源和免費的規(guī)格,是WebM架構(gòu)的一部分。谷歌已經(jīng)在Chrome瀏覽器和YouTube中整合支持VP9。
與H.265在表面上類似,它同樣可以抓取64×64個超級塊。但265不同的是,它不一定是平方形式的,所以它可以以64×32或4×8的塊來采樣,實現(xiàn)更大的效益。但另一方面,它只有10個預(yù)測模式來重建它們。
兩者都很大程度上簡化了現(xiàn)有這些格式,盡管實現(xiàn)了相近的文件尺寸,有初步的報告認(rèn)為,H.265有更高的圖像質(zhì)量,而VP9對于流媒體來說更加可靠。H.265更大的預(yù)測模型實現(xiàn)了邊緣可視化,而VP9實施更嚴(yán)格的編碼規(guī)則,似乎可以讓流媒體更加連貫和可靠。
H.265與VP9的比較有一點類似于HDMI與DisplayPort的比較。后者以版權(quán)免費的方式去爭取一席空間,但是前者的無處不在的應(yīng)用意味著它會有更廣泛的行業(yè)支持。這也是之前H.264輕松打敗VP8的原因。
與此同時,第三個壓縮格式也在規(guī)劃之中,Xiph.Org基金會開發(fā)了“Daala”,雖然它還比較遙遠(yuǎn),但是Xiph稱其將是性能超越H.265和VP9的新一代規(guī)格。
高像素數(shù)量導(dǎo)致需要更復(fù)雜的編解碼器來最小化帶寬需求。持續(xù)連接PC或TV,平滑處理4K信號的最小碼流是20Mbit/s,例如Netflix要求用戶的互聯(lián)網(wǎng)連接至少提供持續(xù)的25Mbit/s帶寬量。20到25Mbit/s代表帶寬的巨大改善,原生的、非壓縮的4K視頻需要在60Mbit/s的帶寬上才會有好的表現(xiàn)。
對于大多數(shù)的行業(yè)應(yīng)用來說,H.265就是解決這一問題的答案之一,但是也要付出一定代價:顯著增加的算法復(fù)雜性據(jù)說需要10倍目前2K部署所用H.264編解碼器的計算能力來支撐,而提供這種能力所需的硅也遠(yuǎn)非一個簡單的商品條目。
很多制造商希望在上游芯片和IC技術(shù)供應(yīng)商的努力之下,解決成本和功能不平衡的問題,讓H.265快速取代H264。就目前來看,H.265在廣電領(lǐng)域已經(jīng)有比較好的發(fā)展,但是否也會成為專業(yè)應(yīng)用領(lǐng)域的主流規(guī)范還存有疑問。因為安防監(jiān)控領(lǐng)域等專業(yè)領(lǐng)域不僅受制于上述挑戰(zhàn),而且還要看終端用戶。對于項目化的專業(yè)用戶和需要監(jiān)控的一般消費者而言,平安城市、交通檢測和銀行監(jiān)控這類專業(yè)用戶需要更加穩(wěn)定和可靠的系統(tǒng)。他們中大多數(shù)已經(jīng)在使用現(xiàn)有的技術(shù),對于是否采用H.265還心存猶豫,這就需要更長的驗證周期。
另一方面,中小企業(yè)和家庭、商店用戶等消費者需要低安裝成本,因此更加傾向于采用新技術(shù)。基于這個原因,H.265可能首先在中小企業(yè)應(yīng)用中獲得成功,并在消費者市場獲得認(rèn)可。如果H.265標(biāo)準(zhǔn)快速成熟,其壓縮效率比H.264提升50%,它就能夠節(jié)省20%的投資,保證更高的性能和更替的網(wǎng)絡(luò)和系統(tǒng)建設(shè)成本。