大有可為！多模態(tài)+大模型廣電新質(zhì)生產(chǎn)力向“智”而行

2024-10-13 依馬獅視聽工場

10月11日上午，第二十九屆媒體融合活動(dòng)（ICTC2024）“智能媒體與智能傳播”分論壇在杭州召開。論壇由中國廣播電視社會(huì)組織聯(lián)合會(huì)、中國廣電網(wǎng)絡(luò)股份有限公司主辦，浙江傳媒學(xué)院媒體工程學(xué)院、智能媒體浙江省工程研究中心承辦。

大有可為！多模態(tài)+大模型廣電新質(zhì)生產(chǎn)力向“智”而行

浙江傳媒學(xué)院媒體工程學(xué)院院長、教授俞定國在致辭中表示，近年來，以人工智能為代表的新技術(shù)快速發(fā)展，對媒體行業(yè)的發(fā)展產(chǎn)生重大影響，智能媒體和智能傳播已成為當(dāng)下行業(yè)的高頻詞匯。人工智能驅(qū)動(dòng)的多模態(tài)計(jì)算，是目前智能媒體領(lǐng)域亟待解決的關(guān)鍵技術(shù)問題，深入探討這一領(lǐng)域的前沿技術(shù)具有重大意義。目前，浙江傳媒學(xué)院媒體工程學(xué)院建有全省影視媒體技術(shù)研究重點(diǎn)實(shí)驗(yàn)室、智能媒體浙江省工程研究中心、國家廣電總局媒體智能傳播技術(shù)研究實(shí)驗(yàn)室等3個(gè)省部級科研平臺(tái)，以及國內(nèi)首個(gè)“5G+4K”電競綜合實(shí)驗(yàn)室，擁有5G超高清視頻技術(shù)、廣電技術(shù)、廣電通信、動(dòng)畫與數(shù)字技術(shù)等4個(gè)省級重點(diǎn)實(shí)驗(yàn)教學(xué)示范中心，為技術(shù)研發(fā)與人才培養(yǎng)提供了有力保障。

大有可為！多模態(tài)+大模型廣電新質(zhì)生產(chǎn)力向“智”而行

浙江大學(xué)求實(shí)特聘教授李璽以“多模態(tài)視覺結(jié)構(gòu)學(xué)習(xí)”為主題，闡述了數(shù)據(jù)驅(qū)動(dòng)的人工智能學(xué)習(xí)方法，并以人臉識別應(yīng)用為例，對比了傳統(tǒng)的識別技術(shù)與基于神經(jīng)網(wǎng)絡(luò)的識別技術(shù)的區(qū)別。其從目標(biāo)視覺感知特性、視覺特征表達(dá)、深度學(xué)習(xí)器構(gòu)建機(jī)制、高層語義理解等多維度視角進(jìn)行了深入剖析，并引入了大規(guī)模多模態(tài)特征學(xué)習(xí)所涉及的主要研究問題和技術(shù)方法。

大有可為！多模態(tài)+大模型廣電新質(zhì)生產(chǎn)力向“智”而行

浙江工業(yè)大學(xué)計(jì)算機(jī)網(wǎng)絡(luò)研究所副所長、教授孫國道作“多模態(tài)數(shù)據(jù)的智能可視分析”報(bào)告，提出圍繞多模態(tài)數(shù)據(jù)的處理、表達(dá)和理解等基礎(chǔ)理論方法，解決數(shù)據(jù)要素、可視表達(dá)和認(rèn)知效率間的復(fù)雜映射關(guān)系構(gòu)建，并應(yīng)用于電子商務(wù)、安防監(jiān)控、城市交通管理等領(lǐng)域，可視化技術(shù)在未來的發(fā)展中發(fā)揮關(guān)鍵性作用。

大有可為！多模態(tài)+大模型廣電新質(zhì)生產(chǎn)力向“智”而行

浙江廣播電視集團(tuán)融媒體技術(shù)中心副主任錢永江在“廣電新質(zhì)生產(chǎn)力的探索和思考”的主題報(bào)告中提出，從生成式人工智能、虛擬數(shù)字人、MR混合虛擬現(xiàn)實(shí)、智能生產(chǎn)、云播出、跨模態(tài)智能媒資6個(gè)技術(shù)方面，介紹了浙江廣播電視集團(tuán)利用人工智能技術(shù)，確保內(nèi)容安全和高效率生產(chǎn)的案例，并以基于大模型的新聞內(nèi)容生產(chǎn)為例，詳細(xì)介紹了大模型在選題、腳本、文稿等環(huán)節(jié)的重要作用。

大有可為！多模態(tài)+大模型廣電新質(zhì)生產(chǎn)力向“智”而行

杭州電子科技大學(xué)計(jì)算機(jī)學(xué)院學(xué)術(shù)副院長、教授余宙指出多模態(tài)學(xué)習(xí)一直以來被看作是通用人工智能的基石，典型的多模塊任務(wù)包括圖文檢索、視覺問答、視覺定位、視覺描述、擴(kuò)模態(tài)生成等。多模態(tài)學(xué)習(xí)范式演進(jìn)在任務(wù)層面呈現(xiàn)由“粗”到“細(xì)”，在模型層面呈現(xiàn)由“專”到“通”，在學(xué)習(xí)層面呈現(xiàn)由“訓(xùn)練”到“提示”的特性。在大模型技術(shù)主導(dǎo)的當(dāng)今，仍有許多值得研究的課題，如多模態(tài)大模型的幻覺、模型的高效推理、大小模型協(xié)同機(jī)制等。

大有可為！多模態(tài)+大模型廣電新質(zhì)生產(chǎn)力向“智”而行

浙江傳媒學(xué)院智能媒體研究院博士馬小雨提出，超高清視頻所提供的良好觀看體驗(yàn)必須建立在存儲(chǔ)傳輸資源充足、拍攝質(zhì)量精良的基礎(chǔ)上；超高清內(nèi)容具有轉(zhuǎn)碼需求高、拍攝制作難度大的特點(diǎn)，相較于傳統(tǒng)視頻更易出現(xiàn)各類型畫質(zhì)損傷，對視頻中心的服務(wù)質(zhì)量保障帶來挑戰(zhàn)；通過語義－質(zhì)量解耦的視覺信息質(zhì)量評價(jià)方法，可以實(shí)現(xiàn)超高清視頻服務(wù)質(zhì)量的保障。

多模態(tài)+大模型，搭載“智能”的東風(fēng)，可以想見，新質(zhì)生產(chǎn)力將推動(dòng)廣電行業(yè)產(chǎn)生深刻變革。向“智”而行，大有可為。

ICTC2024 智能媒體與智能傳播分論壇