英國智能視頻編碼和分發技術提供商iSize Technologies將在IBC 2019描述深度神經網絡將如何在不破壞編碼過程的情況下,增強和加快現有的互聯網視頻編碼標準。
ize Technologies CTO揚尼斯·安德里奧普洛斯博士表示,科技徹底改變了我們消費內容的方式。OTT流媒體內容的激增現在與人們對4K、8K及更高分辨率內容的需求相匹配,但即使是HD/UHD內容的傳輸也仍然受到寬帶基礎設施瓶頸的阻礙。
他表示,深度神經網絡學習將結合現有的編碼標準,如MPEG HEVC、谷歌VP9和AOMedia AV1,為這個問題提供解決方案。
iSize認為,今天的編碼器和解碼器增加了復雜性,并且沒有得到消費者設備和網絡瀏覽器的良好支持。
安德里奧普洛斯進一步解釋說:“HEVC的標準化在2013年完成,但是主流瀏覽器如Chrome和火狐仍然不支持HEVC解碼。確實,谷歌VP9編碼和解碼得到了更廣泛的支持,但是VP9通常被發現對消費電子產品來說很復雜,而且能耗高,而且與較老標準(如AVC和HEVC)的優化實現相比,它并沒有提供非常顯著的比特率節省。”
“總的來說,眾所周知,為各種編碼標準、比特率和傳輸條件優化編碼是非常困難的,最終往往通過預先準備的編碼和流媒體‘配方’來‘解決’,比如主流云編碼器和主流OTT流解決方案中可用的檔和VBV優化。我們發現有一個更好的方法來解決這個問題。”
iSize提出了一種數據驅動的方法來解決這個問題,他們提供了深度視頻預編碼(DVP)的新概念,而不是以靜態方式在內部定制編碼器選項或采用不針對輸入內容和編碼器的樣板流方法。
DVP將輸入視頻幀映射到更小的像素空間,這使得編碼器更高效。這也很自然地壓縮了內容,因為編碼器只處理6%到64%的原始視頻分辨率像素。它作為對客戶端設備上現有編解碼器和現有擴展解決方案的增強選項,不需要對當前的軟硬件播放器或解碼器環境進行任何更改。顯而易見的好處是,這種方法克服了所謂的機器學習 “隱性技術債務”,因為它不需要在編碼、傳輸或解碼方面做出任何改變。