一個旨在使用人工智能提高數(shù)據(jù)壓縮效率的新團(tuán)體于9月30日成立。國際非營利組織“人工智能移動圖像、音頻和數(shù)據(jù)編碼”(MPAI)成立的背后有幾股推動力。

其中一個推動力是需要有一個響應(yīng)行業(yè)需求的組織,其使命是為一系列應(yīng)用開發(fā)數(shù)據(jù)編碼標(biāo)準(zhǔn),而人工智能是其核心實(shí)現(xiàn)技術(shù)。在過去,大幅減少數(shù)據(jù)量(壓縮)已經(jīng)成為從廣播到電信、IT和相關(guān)行業(yè)的各種業(yè)務(wù)的成功因素。
為了響應(yīng)對更多壓縮的要求,MPAI計劃制定AI賦能的標(biāo)準(zhǔn),進(jìn)一步提高已經(jīng)從壓縮中受益的數(shù)據(jù)類型的編碼效率,并將編碼的好處帶給新的數(shù)據(jù)類型。AI賦能編碼的一個例子是“引出”與應(yīng)用程序相關(guān)的數(shù)據(jù)語義方面。
第二個推動力是需要克服公平、合理和非歧視(FRAND)許可聲明的局限性,這是許多標(biāo)準(zhǔn)制定組織及其行業(yè)迫切需要解決的問題。MPAI計劃通過為每個MPAI標(biāo)準(zhǔn)開發(fā)一個“框架許可”(即商業(yè)模式)來解決這個問題。
就在去年夏天MPAI成立后,一群業(yè)內(nèi)同行合作創(chuàng)建了一組用例。很快形成的一個項目是基于環(huán)境的音頻增強(qiáng)(MPAI-CAE),旨在改善各種應(yīng)用的用戶體驗,如各種環(huán)境下(如家中、車中、移動中、演播室中等)的娛樂、通信、電話會議、游戲、后期制作、修復(fù)等。
還有兩個項目正在籌備中。第一個是基于AI的基因組/傳感器實(shí)驗綜合分析(MPAI-GSA),它定義了一個框架,在這個框架中,基于AI或傳統(tǒng)的可免費(fèi)或收費(fèi)的處理組件可以被組合到特定應(yīng)用的“處理應(yīng)用程序”中,從而創(chuàng)造了一個水平市場。第二個項目是AI增強(qiáng)的視頻編碼(MPAI-EVC),這是一種視頻壓縮標(biāo)準(zhǔn),通過用基于AI的工具改進(jìn)或替代傳統(tǒng)的編碼工具,大幅提高傳統(tǒng)視頻編解碼的性能。
其它正在開發(fā)的項目包括:
基于服務(wù)器的預(yù)測性多人游戲(MPAI-SPG)旨在通過收集來自參與某一游戲的客戶的數(shù)據(jù),并將其輸送到一個基于AI的系統(tǒng)預(yù)測每個參與者的移動,從而降低多人在線游戲玩家體驗到的視覺不連續(xù)性。
多模態(tài)對話(MPAI-MMC)為定義基于AI的處理組件的框架(如多模態(tài)輸入融合、自然語言理解與生成、語音識別與合成、情感識別、手勢識別、意圖理解和知識融合等)的標(biāo)準(zhǔn)。對這些組件進(jìn)行適當(dāng)?shù)木幣趴梢詫?shí)現(xiàn)與機(jī)器的通信形式,從而在完整性和強(qiáng)度上仿真人與人之間的通信。
MPAI的工作進(jìn)展很快。上面提到的幾個項目(如MPAI-CAE、MPAI-GSA、MPAI-SPG和MPAI-MMC)共享一個共同的組件AI框架MPAI-AIF,它結(jié)合了不同的基于AI的處理模塊,響應(yīng)應(yīng)用要求。