

10月11日上午,第二十九屆媒體融合活動(ICTC2024)“智能媒體與智能傳播”分論壇在杭州召開。論壇由中國廣播電視社會組織聯合會、中國廣電網絡股份有限公司主辦,浙江傳媒學院媒體工程學院、智能媒體浙江省工程研究中心承辦。

浙江傳媒學院媒體工程學院院長、教授俞定國在致辭中表示,近年來,以人工智能為代表的新技術快速發展,對媒體行業的發展產生重大影響,智能媒體和智能傳播已成為當下行業的高頻詞匯。人工智能驅動的多模態計算,是目前智能媒體領域亟待解決的關鍵技術問題,深入探討這一領域的前沿技術具有重大意義。目前,浙江傳媒學院媒體工程學院建有全省影視媒體技術研究重點實驗室、智能媒體浙江省工程研究中心、國家廣電總局媒體智能傳播技術研究實驗室等3個省部級科研平臺,以及國內首個“5G+4K”電競綜合實驗室,擁有5G超高清視頻技術、廣電技術、廣電通信、動畫與數字技術等4個省級重點實驗教學示范中心,為技術研發與人才培養提供了有力保障。

浙江大學求實特聘教授李璽以“多模態視覺結構學習”為主題,闡述了數據驅動的人工智能學習方法,并以人臉識別應用為例,對比了傳統的識別技術與基于神經網絡的識別技術的區別。其從目標視覺感知特性、視覺特征表達、深度學習器構建機制、高層語義理解等多維度視角進行了深入剖析,并引入了大規模多模態特征學習所涉及的主要研究問題和技術方法。

浙江工業大學計算機網絡研究所副所長、教授孫國道作“多模態數據的智能可視分析”報告,提出圍繞多模態數據的處理、表達和理解等基礎理論方法,解決數據要素、可視表達和認知效率間的復雜映射關系構建,并應用于電子商務、安防監控、城市交通管理等領域,可視化技術在未來的發展中發揮關鍵性作用。

浙江廣播電視集團融媒體技術中心副主任錢永江在“廣電新質生產力的探索和思考”的主題報告中提出,從生成式人工智能、虛擬數字人、MR混合虛擬現實、智能生產、云播出、跨模態智能媒資6個技術方面,介紹了浙江廣播電視集團利用人工智能技術,確保內容安全和高效率生產的案例,并以基于大模型的新聞內容生產為例,詳細介紹了大模型在選題、腳本、文稿等環節的重要作用。

杭州電子科技大學計算機學院學術副院長、教授余宙指出多模態學習一直以來被看作是通用人工智能的基石,典型的多模塊任務包括圖文檢索、視覺問答、視覺定位、視覺描述、擴模態生成等。多模態學習范式演進在任務層面呈現由“粗”到“細”,在模型層面呈現由“專”到“通”,在學習層面呈現由“訓練”到“提示”的特性。在大模型技術主導的當今,仍有許多值得研究的課題,如多模態大模型的幻覺、模型的高效推理、大小模型協同機制等。

浙江傳媒學院智能媒體研究院博士馬小雨提出,超高清視頻所提供的良好觀看體驗必須建立在存儲傳輸資源充足、拍攝質量精良的基礎上;超高清內容具有轉碼需求高、拍攝制作難度大的特點,相較于傳統視頻更易出現各類型畫質損傷,對視頻中心的服務質量保障帶來挑戰;通過語義-質量解耦的視覺信息質量評價方法,可以實現超高清視頻服務質量的保障。
多模態+大模型,搭載“智能”的東風,可以想見,新質生產力將推動廣電行業產生深刻變革。向“智”而行,大有可為。