一個(gè)旨在使用人工智能提高數(shù)據(jù)壓縮效率的新團(tuán)體于9月30日成立。國際非營利組織“人工智能移動(dòng)圖像、音頻和數(shù)據(jù)編碼”(MPAI)成立的背后有幾股推動(dòng)力。

其中一個(gè)推動(dòng)力是需要有一個(gè)響應(yīng)行業(yè)需求的組織,其使命是為一系列應(yīng)用開發(fā)數(shù)據(jù)編碼標(biāo)準(zhǔn),而人工智能是其核心實(shí)現(xiàn)技術(shù)。在過去,大幅減少數(shù)據(jù)量(壓縮)已經(jīng)成為從廣播到電信、IT和相關(guān)行業(yè)的各種業(yè)務(wù)的成功因素。
為了響應(yīng)對(duì)更多壓縮的要求,MPAI計(jì)劃制定AI賦能的標(biāo)準(zhǔn),進(jìn)一步提高已經(jīng)從壓縮中受益的數(shù)據(jù)類型的編碼效率,并將編碼的好處帶給新的數(shù)據(jù)類型。AI賦能編碼的一個(gè)例子是“引出”與應(yīng)用程序相關(guān)的數(shù)據(jù)語義方面。
第二個(gè)推動(dòng)力是需要克服公平、合理和非歧視(FRAND)許可聲明的局限性,這是許多標(biāo)準(zhǔn)制定組織及其行業(yè)迫切需要解決的問題。MPAI計(jì)劃通過為每個(gè)MPAI標(biāo)準(zhǔn)開發(fā)一個(gè)“框架許可”(即商業(yè)模式)來解決這個(gè)問題。
就在去年夏天MPAI成立后,一群業(yè)內(nèi)同行合作創(chuàng)建了一組用例。很快形成的一個(gè)項(xiàng)目是基于環(huán)境的音頻增強(qiáng)(MPAI-CAE),旨在改善各種應(yīng)用的用戶體驗(yàn),如各種環(huán)境下(如家中、車中、移動(dòng)中、演播室中等)的娛樂、通信、電話會(huì)議、游戲、后期制作、修復(fù)等。
還有兩個(gè)項(xiàng)目正在籌備中。第一個(gè)是基于AI的基因組/傳感器實(shí)驗(yàn)綜合分析(MPAI-GSA),它定義了一個(gè)框架,在這個(gè)框架中,基于AI或傳統(tǒng)的可免費(fèi)或收費(fèi)的處理組件可以被組合到特定應(yīng)用的“處理應(yīng)用程序”中,從而創(chuàng)造了一個(gè)水平市場。第二個(gè)項(xiàng)目是AI增強(qiáng)的視頻編碼(MPAI-EVC),這是一種視頻壓縮標(biāo)準(zhǔn),通過用基于AI的工具改進(jìn)或替代傳統(tǒng)的編碼工具,大幅提高傳統(tǒng)視頻編解碼的性能。
其它正在開發(fā)的項(xiàng)目包括:
基于服務(wù)器的預(yù)測性多人游戲(MPAI-SPG)旨在通過收集來自參與某一游戲的客戶的數(shù)據(jù),并將其輸送到一個(gè)基于AI的系統(tǒng)預(yù)測每個(gè)參與者的移動(dòng),從而降低多人在線游戲玩家體驗(yàn)到的視覺不連續(xù)性。
多模態(tài)對(duì)話(MPAI-MMC)為定義基于AI的處理組件的框架(如多模態(tài)輸入融合、自然語言理解與生成、語音識(shí)別與合成、情感識(shí)別、手勢(shì)識(shí)別、意圖理解和知識(shí)融合等)的標(biāo)準(zhǔn)。對(duì)這些組件進(jìn)行適當(dāng)?shù)木幣趴梢詫?shí)現(xiàn)與機(jī)器的通信形式,從而在完整性和強(qiáng)度上仿真人與人之間的通信。
MPAI的工作進(jìn)展很快。上面提到的幾個(gè)項(xiàng)目(如MPAI-CAE、MPAI-GSA、MPAI-SPG和MPAI-MMC)共享一個(gè)共同的組件AI框架MPAI-AIF,它結(jié)合了不同的基于AI的處理模塊,響應(yīng)應(yīng)用要求。