大有可為！多模態+大模型廣電新質生產力向“智”而行

2024-10-13 依馬獅視聽工場

10月11日上午，第二十九屆媒體融合活動（ICTC2024）“智能媒體與智能傳播”分論壇在杭州召開。論壇由中國廣播電視社會組織聯合會、中國廣電網絡股份有限公司主辦，浙江傳媒學院媒體工程學院、智能媒體浙江省工程研究中心承辦。

大有可為！多模態+大模型廣電新質生產力向“智”而行

浙江傳媒學院媒體工程學院院長、教授俞定國在致辭中表示，近年來，以人工智能為代表的新技術快速發展，對媒體行業的發展產生重大影響，智能媒體和智能傳播已成為當下行業的高頻詞匯。人工智能驅動的多模態計算，是目前智能媒體領域亟待解決的關鍵技術問題，深入探討這一領域的前沿技術具有重大意義。目前，浙江傳媒學院媒體工程學院建有全省影視媒體技術研究重點實驗室、智能媒體浙江省工程研究中心、國家廣電總局媒體智能傳播技術研究實驗室等3個省部級科研平臺，以及國內首個“5G+4K”電競綜合實驗室，擁有5G超高清視頻技術、廣電技術、廣電通信、動畫與數字技術等4個省級重點實驗教學示范中心，為技術研發與人才培養提供了有力保障。

大有可為！多模態+大模型廣電新質生產力向“智”而行

浙江大學求實特聘教授李璽以“多模態視覺結構學習”為主題，闡述了數據驅動的人工智能學習方法，并以人臉識別應用為例，對比了傳統的識別技術與基于神經網絡的識別技術的區別。其從目標視覺感知特性、視覺特征表達、深度學習器構建機制、高層語義理解等多維度視角進行了深入剖析，并引入了大規模多模態特征學習所涉及的主要研究問題和技術方法。

大有可為！多模態+大模型廣電新質生產力向“智”而行

浙江工業大學計算機網絡研究所副所長、教授孫國道作“多模態數據的智能可視分析”報告，提出圍繞多模態數據的處理、表達和理解等基礎理論方法，解決數據要素、可視表達和認知效率間的復雜映射關系構建，并應用于電子商務、安防監控、城市交通管理等領域，可視化技術在未來的發展中發揮關鍵性作用。

大有可為！多模態+大模型廣電新質生產力向“智”而行

浙江廣播電視集團融媒體技術中心副主任錢永江在“廣電新質生產力的探索和思考”的主題報告中提出，從生成式人工智能、虛擬數字人、MR混合虛擬現實、智能生產、云播出、跨模態智能媒資6個技術方面，介紹了浙江廣播電視集團利用人工智能技術，確保內容安全和高效率生產的案例，并以基于大模型的新聞內容生產為例，詳細介紹了大模型在選題、腳本、文稿等環節的重要作用。

大有可為！多模態+大模型廣電新質生產力向“智”而行

杭州電子科技大學計算機學院學術副院長、教授余宙指出多模態學習一直以來被看作是通用人工智能的基石，典型的多模塊任務包括圖文檢索、視覺問答、視覺定位、視覺描述、擴模態生成等。多模態學習范式演進在任務層面呈現由“粗”到“細”，在模型層面呈現由“專”到“通”，在學習層面呈現由“訓練”到“提示”的特性。在大模型技術主導的當今，仍有許多值得研究的課題，如多模態大模型的幻覺、模型的高效推理、大小模型協同機制等。

大有可為！多模態+大模型廣電新質生產力向“智”而行

浙江傳媒學院智能媒體研究院博士馬小雨提出，超高清視頻所提供的良好觀看體驗必須建立在存儲傳輸資源充足、拍攝質量精良的基礎上；超高清內容具有轉碼需求高、拍攝制作難度大的特點，相較于傳統視頻更易出現各類型畫質損傷，對視頻中心的服務質量保障帶來挑戰；通過語義－質量解耦的視覺信息質量評價方法，可以實現超高清視頻服務質量的保障。

多模態+大模型，搭載“智能”的東風，可以想見，新質生產力將推動廣電行業產生深刻變革。向“智”而行，大有可為。

ICTC2024 智能媒體與智能傳播分論壇