
在體育運(yùn)動(dòng)中,口頭詞句對(duì)比賽如何展開(kāi)、運(yùn)動(dòng)員如何觀察和與他人互動(dòng),以及球迷如何回應(yīng)動(dòng)作都至關(guān)重要。訪問(wèn)所有這些對(duì)話(huà)從未如此容易,也從未如此有趣,但還有更多的價(jià)值。
現(xiàn)在技術(shù)正在成熟,可以為這些對(duì)話(huà)注入更深入、實(shí)時(shí)的智能。對(duì)于體育制作人和導(dǎo)播來(lái)說(shuō),通過(guò)即時(shí)、自動(dòng)的洞察,在精確的時(shí)刻有警告以及可搜索地實(shí)時(shí)訪問(wèn)大量人聲互動(dòng)具有很大的吸引力。更快地訪問(wèn)賽場(chǎng)內(nèi)外產(chǎn)生重大影響的時(shí)刻,只會(huì)豐富現(xiàn)場(chǎng)制作團(tuán)隊(duì)和觀眾以及后期制作可用的內(nèi)容。
擁抱電視的“第三軌”
這些額外的接觸點(diǎn)可以通過(guò)擁抱我們所說(shuō)的電視內(nèi)容的“第三軌”實(shí)現(xiàn)。除了視頻和音頻之外,通過(guò)自動(dòng)為場(chǎng)館的每個(gè)話(huà)筒信號(hào)配字幕而生成的原始文本可以實(shí)時(shí)生成大量由語(yǔ)音生成的數(shù)據(jù)。
然后,這些數(shù)據(jù)可被用于監(jiān)看靠近(或佩戴)特定話(huà)筒的人所說(shuō)的任何特殊關(guān)鍵字,生成邏輯元數(shù)據(jù)標(biāo)記和警報(bào),并建立一個(gè)可實(shí)時(shí)或以后的時(shí)間跳過(guò)的“面包屑”存儲(chǔ)數(shù)據(jù)集。
采取這些從許多話(huà)筒信號(hào)源創(chuàng)建文本記錄的措施,需要巨大的改變。使用傳統(tǒng)的速記方法來(lái)生成這些字幕是非常昂貴的。
不過(guò),由于基于AI的自動(dòng)語(yǔ)音識(shí)別(ASR)的巨大進(jìn)步,現(xiàn)在可以采用一個(gè)快速、可靠和高度準(zhǔn)確的技術(shù)平臺(tái)同時(shí)在許多音頻通道上生成原始文本。通過(guò)生成實(shí)時(shí)內(nèi)容的文本記錄,每個(gè)ASR流都有自己的路徑,并且可以與其自己的話(huà)筒源(以及任何相關(guān)的攝像機(jī))掛鉤。
為更好的直播內(nèi)容配字幕
想象一下,將來(lái)自一個(gè)有時(shí)特別健談的某位運(yùn)動(dòng)員的獵槍式話(huà)筒或領(lǐng)夾式話(huà)筒信號(hào)記錄到ASR,該運(yùn)動(dòng)員可能會(huì)說(shuō)某些制作人確定對(duì)比賽轉(zhuǎn)播很關(guān)鍵的話(huà)語(yǔ)(也許是與比賽戰(zhàn)略、其他選手、天氣或其它因素有關(guān)的話(huà)語(yǔ))。
現(xiàn)在想象一下,你有一臺(tái)ISO攝像機(jī)對(duì)準(zhǔn)他們,只是在等待一個(gè)視覺(jué)時(shí)刻。一旦你開(kāi)始為信號(hào)添加字幕,一個(gè)后端自動(dòng)化進(jìn)程就會(huì)生成一個(gè)警報(bào),告訴制作人回顧視頻中說(shuō)到的關(guān)鍵字。其結(jié)果是立即獲得你正在尋找的所需的實(shí)時(shí)有用信息。
賽車(chē)引入另一個(gè)有趣的用例,即利用ASR記錄和生成賽車(chē)的文本。每當(dāng)某些車(chē)手提到了指定的關(guān)鍵字,音頻(和視頻)就可以標(biāo)記并發(fā)送給制作人,考慮在直播中或通過(guò)社交媒體回放。
比賽中回放應(yīng)用
比賽中回放應(yīng)用提供了另一種吸引人的方法。想象一下,當(dāng)裁判提到用戶(hù)在節(jié)目前預(yù)存的某些重要詞語(yǔ)時(shí),將話(huà)筒和攝像機(jī)集中于裁判,捕捉關(guān)鍵時(shí)刻。雖然您可以讓操作員記錄他們的對(duì)話(huà),但并不是所有內(nèi)容都可以準(zhǔn)確地記錄。

如果你有一個(gè)實(shí)時(shí)ASR運(yùn)行在裁判員的音頻信號(hào)上,通過(guò)正確的軟件,你可以在他們的回放視頻中執(zhí)行文本詞搜索,以導(dǎo)航到他們說(shuō)了你想要的詞語(yǔ)的時(shí)刻,從而在制作中更快地訪問(wèn)。關(guān)鍵字搜索也可以在后期制作中完成,只要用戶(hù)為每個(gè)話(huà)筒信號(hào)保存ASR文本記錄(理想情況下,還可以有主題的攝像機(jī)視圖,以幫助精確定位和顯現(xiàn)感興趣的東西)。
這個(gè)語(yǔ)音數(shù)據(jù)寶庫(kù)可以打開(kāi)一個(gè)充滿(mǎn)創(chuàng)造性可能性的全新世界。制作團(tuán)隊(duì)不再受限于他們的工作人員可以聽(tīng)到或看到的內(nèi)容,并手動(dòng)決定或注釋。有了ASR,就可能有當(dāng)某些運(yùn)動(dòng)員或其他人說(shuō)出神奇詞語(yǔ)時(shí),幫助用戶(hù)“密切注意”那些特殊的時(shí)刻的自動(dòng)化進(jìn)程。
ASR通過(guò)邏輯標(biāo)記、元數(shù)據(jù)或其它通知,有效地提醒用戶(hù)到那個(gè)時(shí)刻。從那里,只需向后搜索文本指示的時(shí)間點(diǎn),就可以訪問(wèn)音頻。
廣播公司可以運(yùn)用與此同樣的技術(shù),每當(dāng)現(xiàn)場(chǎng)轉(zhuǎn)播或PA廣播員提到特定的詞語(yǔ)或名字時(shí)進(jìn)行標(biāo)記。某一運(yùn)動(dòng)員做了(或說(shuō)了)一些有趣的事情嗎?廣播員上次提到該運(yùn)動(dòng)員的名字是什么時(shí)候?現(xiàn)在用戶(hù)可以搜索到那個(gè)時(shí)間點(diǎn),并確定是否有吸引人的鏡頭。
盡管字幕對(duì)幫助耳聾者和聽(tīng)力不好者至關(guān)重要,但它不僅僅是為了遵從美國(guó)聯(lián)邦通信委員會(huì)(FCC)規(guī)定的可訪問(wèn)性。基于AI的語(yǔ)音轉(zhuǎn)文本技術(shù)在過(guò)去幾年里發(fā)生了巨大的發(fā)展。利用體育領(lǐng)域中的這些進(jìn)展為豐富您的內(nèi)容提供了無(wú)限的可能性,并激發(fā)體育迷體驗(yàn),讓他們經(jīng)常回到體育場(chǎng)館。