啊用力?嗯?轻一点原神宵宫,尿口扩张videos,国产精品久久久久精品爆乳接种 ,荡公乱妇HD电影中文字幕


微博

QQ

基于視頻比對(duì)和網(wǎng)絡(luò)爬蟲技術(shù)的版權(quán)維權(quán)研究與探索

2021-03-19 吳夢(mèng)霞 重慶廣播電視集團(tuán)(總臺(tái)) 依馬獅視聽工場(chǎng)


【摘要】 隨著廣電媒資(MAM)影像資料內(nèi)部和外部使用量的急劇增長(zhǎng),隨之而來的版權(quán)被侵權(quán)問題日益凸顯——互聯(lián)網(wǎng)(新媒體)公司未經(jīng)版權(quán)授權(quán),擅自在各種平臺(tái)使用,給版權(quán)管理和開發(fā)工作帶來很大的影響。原有傳統(tǒng)的人工維權(quán)方式在互聯(lián)網(wǎng)信息海量的狀況下,顯得效率極其低下,本文探索以人工智能爬蟲、視頻比對(duì)和區(qū)塊鏈存證三個(gè)核心技術(shù)為基礎(chǔ)打造的版權(quán)維權(quán)系統(tǒng)。

【關(guān)鍵詞】媒資(MAM) 確權(quán) 數(shù)據(jù)采集 區(qū)塊鏈(Blockchain) 網(wǎng)絡(luò)爬蟲(General Purpose Web Crawler)  視頻比對(duì)(visual comparision)


一.項(xiàng)目背景

全國(guó)各廣電在媒資日常管理和對(duì)外開發(fā)中,隨著媒資內(nèi)部和外部使用量的急劇增長(zhǎng),隨之而來的版權(quán)被侵權(quán)問題日益凸顯———外部互聯(lián)網(wǎng)(新媒體)公司未經(jīng)授權(quán),擅自在各種平臺(tái)使用版權(quán)影像資料的情況大量出現(xiàn)。給媒資管理和開發(fā)工作帶來很大的影響:一是媒資資料被隨意改編、編排而歪曲媒資本身內(nèi)容,造成一定程度上的不良傳播;二是不受版權(quán)限制的媒資資料有被隨意傳播、泄露的風(fēng)險(xiǎn);三是造成媒資資料價(jià)值的嚴(yán)重流失,給正規(guī)的媒資版權(quán)開發(fā)造成很大的沖擊。

原有傳統(tǒng)的維權(quán)方式是等待被動(dòng)告知侵權(quán)情況后,然后再進(jìn)行人工網(wǎng)絡(luò)篩查、比對(duì)、確權(quán)、取證等操作,在互聯(lián)網(wǎng)信息海量的狀況下,顯得效率極其低下。比如1-2媒資人員專職負(fù)責(zé)搜集和取證,每天僅能完成20~50個(gè)URL的檢索,比對(duì)和網(wǎng)絡(luò)取證工作,這樣的效率完全不能滿足維權(quán)需要,搜集取證的速度還比不上侵權(quán)的增長(zhǎng)速度,對(duì)媒資版權(quán)維權(quán)監(jiān)控工作造成了很大困難。

基于視頻比對(duì)和網(wǎng)絡(luò)爬蟲技術(shù)的版權(quán)維權(quán)研究與探索

圖1 區(qū)塊鏈技術(shù)

針對(duì)以上的問題,本文探索自主研發(fā)媒資影像資料版權(quán)維權(quán)系統(tǒng),以人工智能爬蟲、視頻比對(duì)和區(qū)塊鏈存證三個(gè)核心技術(shù)為基礎(chǔ)打造的版權(quán)維權(quán)系統(tǒng)。系統(tǒng)主要通過人工智能爬蟲對(duì)互聯(lián)網(wǎng)網(wǎng)站進(jìn)行遞歸式查找和搜索,并通過和廣電內(nèi)部媒資庫進(jìn)行視頻比對(duì)來進(jìn)行侵權(quán)界定,確認(rèn)侵權(quán)后采用區(qū)塊鏈技術(shù)進(jìn)行證據(jù)固化。這樣全自動(dòng)化、24小時(shí)不間斷的人工智能檢索和確權(quán),大幅度提升了日常維權(quán)的能力和手段,為實(shí)現(xiàn)媒資資料規(guī)范化管理和維權(quán),以及后期媒資媒體融合開發(fā)、拓展奠定了技術(shù)基礎(chǔ)。

二.關(guān)鍵技術(shù)點(diǎn)

區(qū)塊鏈存證

區(qū)塊鏈具有去中心化、安全性高、永久存證、無限可溯源和可編程擴(kuò)展性強(qiáng)等特點(diǎn),特別適合于知識(shí)產(chǎn)權(quán)領(lǐng)域應(yīng)用。通過利用區(qū)塊鏈技術(shù)實(shí)現(xiàn)證據(jù)信息的及時(shí)固化與存證,并可在有需要的情況下,向受理公證處申請(qǐng)出具“存證函”,所有的侵權(quán)情況報(bào)表記錄在不可篡改的區(qū)塊鏈內(nèi),作為證據(jù)信息進(jìn)行存證。

存證的內(nèi)容不僅包含了比對(duì)結(jié)果,同時(shí)包括該視頻在監(jiān)控目標(biāo)中的播放截圖、展示名稱、以及其他頁面信息(根據(jù)監(jiān)控目標(biāo)的內(nèi)容差異性,有所不同),形成完整的取證證據(jù)鏈。

人工智能爬蟲

系統(tǒng)使用“聚焦爬蟲”技術(shù),并且加入了部分人工智能算法,進(jìn)一步提升數(shù)據(jù)采集的準(zhǔn)確性。這主要體現(xiàn)在爬蟲對(duì)用戶行為的模擬,以獲取更接近人工操作的行為模式。

一方面,根據(jù)侵權(quán)監(jiān)測(cè)系統(tǒng)的待比對(duì)作品類型不同,對(duì)于爬蟲的采集規(guī)則進(jìn)行了精確優(yōu)化,使爬蟲能夠準(zhǔn)確識(shí)別主標(biāo)題、副標(biāo)題、摘要、作者、正文等信息,模擬用戶在查閱內(nèi)容時(shí)對(duì)不同關(guān)鍵信息的關(guān)注情況。另一方面,對(duì)被采集的內(nèi)容進(jìn)行識(shí)別。將根據(jù)特定字、詞組等關(guān)鍵信息,完成數(shù)據(jù)采集,模擬用戶對(duì)于特定內(nèi)容的關(guān)注情況。

監(jiān)控目標(biāo)采集模塊,即是用于在目標(biāo)App、Web站點(diǎn)中獲取視頻數(shù)據(jù)的采集工具。將根據(jù)實(shí)際的監(jiān)控需求和源視頻的特點(diǎn)采用不同的策略完成采集工作。

視頻比對(duì)

視頻比對(duì)技術(shù)是通過持續(xù)的數(shù)據(jù)采集,再根據(jù)源視頻,主要方式是截取關(guān)鍵幀,轉(zhuǎn)換成特征值。然后爬蟲爬取目標(biāo)視頻,對(duì)視頻進(jìn)行截圖,并根據(jù)視頻的尺寸和位置進(jìn)行裁剪。然后對(duì)截圖進(jìn)行計(jì)算特征值。最后通過對(duì)比算法把源和目標(biāo)的比對(duì),轉(zhuǎn)換成特征值進(jìn)行比對(duì)。

基于視頻比對(duì)和網(wǎng)絡(luò)爬蟲技術(shù)的版權(quán)維權(quán)研究與探索

圖2 視頻比對(duì)示例

然后,在比對(duì)模塊內(nèi)將對(duì)二者的“自編碼”相似性進(jìn)行運(yùn)算與判別,獲取不同幀信息相對(duì)于源視頻的相似度,最終經(jīng)過加權(quán)運(yùn)算,獲得視頻之間的相似度數(shù)值,作為比對(duì)結(jié)果。

三.管理及應(yīng)用

經(jīng)過前期大量研發(fā)和測(cè)試,現(xiàn)系統(tǒng)已初步具備自動(dòng)爬蟲檢索、比對(duì)、區(qū)塊鏈存證等基本功能。系統(tǒng)已于今年初投入到實(shí)際工作流程中進(jìn)行應(yīng)用,并取得相當(dāng)不錯(cuò)的效果,主要實(shí)現(xiàn)了以下管理目標(biāo)和效益:

(1)能夠自動(dòng)從媒資庫中劃定的制定范圍庫中,自動(dòng)抓取媒資內(nèi)容,包含文本、圖片以及音視頻信息;
(2)目前已實(shí)現(xiàn)在目標(biāo)URL中自動(dòng)爬蟲檢索比對(duì)媒資內(nèi)容;
(3)文字、圖片、音頻、視頻等內(nèi)容的獲取、比對(duì)技術(shù)已實(shí)現(xiàn),并具備較為可靠的準(zhǔn)確性;
(4)依照版權(quán)管理的要求,對(duì)比相似度比對(duì)結(jié)果以百分比形式體現(xiàn);
(5)系統(tǒng)控制臺(tái)內(nèi)可獲取站點(diǎn)名稱、發(fā)布時(shí)間、發(fā)布人員、鏈接等關(guān)鍵信息,并可導(dǎo)出Excel表格;
(6)能夠?qū)?shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,形成可視化圖標(biāo);
(7)平臺(tái)底層配備區(qū)塊鏈系統(tǒng),能夠?qū)ΡO(jiān)測(cè)結(jié)果進(jìn)行存證。

圖3為主要用于向用戶展示媒資資料被侵權(quán)情況的整體監(jiān)控統(tǒng)計(jì)。

基于視頻比對(duì)和網(wǎng)絡(luò)爬蟲技術(shù)的版權(quán)維權(quán)研究與探索

圖3 監(jiān)控首頁

對(duì)于某個(gè)平臺(tái)的監(jiān)控結(jié)果,以列表進(jìn)行展示,如圖4所示,將提供被侵權(quán)媒資資料的名稱、平臺(tái)、標(biāo)題及對(duì)應(yīng)的網(wǎng)絡(luò)鏈接。

基于視頻比對(duì)和網(wǎng)絡(luò)爬蟲技術(shù)的版權(quán)維權(quán)研究與探索

圖4  任務(wù)報(bào)表頁面

在應(yīng)用詳情頁中,將展示所發(fā)現(xiàn)的侵權(quán)現(xiàn)象的具體信息,如圖5所示。

基于視頻比對(duì)和網(wǎng)絡(luò)爬蟲技術(shù)的版權(quán)維權(quán)研究與探索

圖5 詳情頁

通過一段時(shí)間的運(yùn)行測(cè)試,系統(tǒng)初步達(dá)到和實(shí)現(xiàn)前期規(guī)劃設(shè)計(jì)的功能,其自動(dòng)內(nèi)容采集技術(shù)以較高的效率完成了待比對(duì)內(nèi)容的獲取工作,配合智能比對(duì)技術(shù),完成了基于內(nèi)容的相似度分析,同期對(duì)比原來人工方式,現(xiàn)在以兩臺(tái)服務(wù)器集群能力,全網(wǎng)爬蟲、對(duì)比、存證能力為原來的8-10倍,顯著提高了對(duì)侵權(quán)情況的發(fā)現(xiàn)能力、發(fā)現(xiàn)效率及時(shí)效性,為應(yīng)對(duì)互聯(lián)網(wǎng)時(shí)代的侵權(quán)挑戰(zhàn)提供了可靠的技術(shù)基礎(chǔ)。

“自動(dòng)化+全時(shí)段”的工作方式在很大程度上能夠代替媒資管理人員現(xiàn)行“高投入、低成效”的工作方式,媒資管理人員可以快速對(duì)侵權(quán)信息結(jié)果進(jìn)行審核,迅速確認(rèn)有效的侵權(quán)信息,從而大幅提升了媒資維權(quán)監(jiān)控的效率,使得媒資管理人員能從繁瑣且重復(fù)的侵權(quán)監(jiān)控工作中解脫出來,將精力更多地投入到媒資創(chuàng)新應(yīng)用和融媒體開發(fā)等工作上。B&P


【參考文獻(xiàn)】

《基于云平臺(tái)的視頻比對(duì)系統(tǒng)研究》章杰 周勤 胡榮標(biāo) 陳青

《基于區(qū)塊鏈的應(yīng)用系統(tǒng)開發(fā)方法研究》 蔡維德 郁蓮 王榮 劉娜 鄧恩艷

《分布式網(wǎng)絡(luò)爬蟲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)》 呂陽

《基于URL規(guī)則的聚焦爬蟲及其應(yīng)用》 葉勤勇

區(qū)塊鏈 網(wǎng)絡(luò)爬蟲 視頻比對(duì)

視聽科技視頻號(hào) 廣告
發(fā)表評(píng)論
主站蜘蛛池模板: 黄色app在线看| 狠狠操天天操| 插棉签车车| 欲色影视天天一区二区三区色香欲| 国产亚洲精品九九久在线观看| 日韩精品片| 撕开她的衣服蹂躏小说| 边吃奶边摸下面很爽h| 国产精品视频牛仔裤一区| 中文字幕1区2区| 好大好快| 粉嫩主播深夜福利视频| 久久三级影院| 欧美videos超乳巨大| 91人妻无码精品一区二区毛片| 202z国外高清191t| 和黑帮大佬的365天免费在看第3部| 特黄特色大片免费视频大全| 特殊性按摩精油| 末发育娇小性色xxxxx| 巜人妻初尝按摩师BD中字| 韩无遮羞免费网站漫画| 爱欲之日| 美女全身裸体秘?免费看网站| genshinhetial本子| 美女扒了内裤让男人桶| 无码毛片一区二区三区视频免费播放| 91在线无码精品秘?入口九| 性一交一乱一伦一A片| 人妻熟女一区二区三区APP下载| 亚洲女教师护士高潮毛茸茸| 中文字幕99在线精品视频免费看| 欧美又黄又嫩大片a级小说| 中文字幕在线二区| 欧美xxxx69| 武则天一级婬片高清免费观看| 午夜精品一区二区三区在线视| 最新国产三级| 海外vps私人毛片| 成人毛片18女人毛片免费看电影 | 久久97精品久久久久久久看片|