AI人工智能是當今社會熱門話題。正面報道盛贊它為一位出色的虛擬助手,而負面聲音則擔憂孩子們可能過于依賴它來完成學業。更令人不安的是,一些悲觀的預言警告說,未來機器人不僅可能取代人類的工作崗位,還可能帶來致命的威脅。
盡管這項技術本身既有巨大可能也有潛在危險,但最好記住,人工智能只是一款可以被用于極好目的的工具。
尤其在現代混合辦公環境中所采用的視聽系統里,這一點顯得極為貼切。

“在快思聰,我們的人工智能解決方案集成1 Beyond智能攝像頭和快思聰Automate VX語音激活追蹤技術等一系列揚聲器解決方案。這些產品利用‘視覺人工智能’技術,為用戶提供卓越的視頻會議體驗,并能與Microsoft Teams® Rooms和Zoom Rooms®軟件等平臺無縫協作,充分發揮各自的人工智能技術優勢。”
這究竟意味著什么?讓我們通過回答三個最常見的問題來逐一解析:
- 什么是“視覺人工智能”,它與智能視頻有何不同?
- 我們需要哪些硬件設備?
- 使用系統時,我需要關注哪些問題?

| 什么是“視覺人工智能”,它與智能視頻有何不同?
您可能已經注意到“智能視頻”與“視覺人工智能”被交替使用。更準確地界定這兩個概念的方法是:視覺人工智能是實現智能視頻體驗所必需的關鍵技術。其結果是,該系統能夠給予面部和動作檢測自動追蹤并定位房間中的演講者——這在包含遠程參與者的會議中極為重要。您希望那些虛擬與會者能看到會議室中人員的手勢和表情。當遠程工作者能夠捕捉到所有這些非語言信號時,他們的參與度會得到增強。
快思聰在智能視頻領域的產品管理總監Rony Sebok,為在線出版物《AI for All》撰寫的一篇文章可以很好地解釋這項技術的強大能力:
視覺人工智能可用于創造多樣性體驗,包括“團體構圖”(調整畫面以顯示所有參與者)、“自動構圖”(當一個人講話時調整畫面)、以及“演講者追蹤”(隨演講者的動作而在空間中移動)。它還可以進一步在房間中自動切換活躍的發言者(“發言者追蹤”),將房間的多個視角合并為單一視頻流等。
就像其它人工智能實例一般,視覺人工智能正在逐漸發展完善。“人工智能已經運用至統一通信中一段時間了,但現在我們正在開發更加高效的‘智能場景控制盒’解決方案,”快思聰市場高級總監Sam Kennedy表示。人工智能也被應用于音頻解決方案中,它能夠屏蔽多余的噪音,甚至可以通過聲音來識別人。

不久之后,人工智能將輔助這些系統實現“環境智能感知”——換言之,對空間進行更深入的信息收集。“這些程序正在學習判斷房間內是否配備白板,并調整系統攝像頭以確保所有遠程參與者都能清晰地看見白板,”Kennedy指出。“未來,人工智能還將能夠識別白板——甚至整個會議室——是否需要為下一場會議進行清潔整理。”
系統將能夠收集更多的環境信息,Kennedy表示:“是否需要在進行演示時降低窗簾?當系統感應到房間內滿員時,是否需要調節溫度?”最終,人工智能將能對遠程與現場的場地體驗兩者都產生影響。
| 我們需要哪些硬件設備?
硬件設備的配置選項有很多?;A級解決方案常見于配備多個攝像頭的視頻會議條,這些攝像頭能夠實現在發言者之間自動切換。對于專為高端會議空間設計的大型系統,可以采用搭載智能視頻技術的攝像頭進行驅動,或與基于麥克風信號來追蹤發言人的解決方案相結合,以便自動跟隨演講者或對話。
快思聰可以提供所有選項配置,包括我們的1 Beyond智能PTZ攝像頭,它具備光學變焦功能,能夠清晰捕捉房間內每位參與者的影像——即使是那些距離鏡頭60英尺遠的人。光學變焦在攝像頭的光學鏡頭內部發生,而數字變焦則是通過放大和裁剪圖像來實現特寫效果。后者會降低圖像的像素精度,隨著放大倍數的增加,清晰度也隨之會降低,削弱了攝像頭捕捉關鍵非語言信號的能力。
另一個選擇是快思聰的Automate VX語音激活的發言人追蹤解決方案。該系統與較大空間的適配性最高,因為您可以同時配置12個攝像頭來處理重要會議空間的需求。
我們的目標是通過視覺人工智能技術實現流暢追蹤與合理構圖,提供清晰的特寫畫面和多角度視圖,使遠程參與者得以體驗卓越的廣播級視頻品質。Automate VX解決方案能夠自動構圖并將發言人置于畫面中心,即便他們移出最初的位置。這樣,參與者便可自由活動,無需擔心自己是否會離開攝像頭的拍攝范圍。
Automate VX解決方案還具有“重構圖”功能,可自動將人物置于鏡頭畫面中心。人工智能在此發揮關鍵作用,它能夠識別動作幅度的大小。Kennedy解釋道:“例如,如果有人輕微地調整坐姿,人工智能不會認為需要重新調整鏡頭畫面構圖。”這減少了不必要的攝像頭移動,有助于避免頻繁或持續性晃動而讓觀看者感到眩暈。

| 使用系統時,我需要關注哪些問題?
簡單來說:隱私和安全是需要持續關注的動態目標
在隱私保護方面,視覺人工智能(Visual AI)通常不會引發警覺,直到它開始識別特定個人。這種識別功能涉及的不僅僅是視覺上的追蹤,還包括其他方面。比如,如果人工智能程序識別了您的面容,這是否侵犯了您的隱私?程序分析并報告會議中的“情緒”,其倫理問題又該如何界定?人工智能是否能“領會”諷刺意味——它能否分辨出玩笑與真正具有負面影響的評論之間的區別?
Kennedy表示,所有系統的默認選項應該是允許用戶“選擇退出”。“我認為,只有征詢人們是否同意被識別和追蹤才符合倫理道德,特別是對于生成性人工智能或虛擬助手程序,”他指出。“如果用戶同意,他們可以通過點擊按鈕立即選擇加入。”同時,他又提到地方法律也在應對這一問題:“在美國的一些州以及全球的許多地方,都明確禁止使用人工智能程序在環境中識別個人。”
考慮到安全性問題,在某些特定環境中將數據上傳至云端是不被允許的。“在信息被政府或企業視為機密的情況下,您是不會希望人工智能將任何數據發送至外部的,” Kennedy說。“這正是集成了人工智能的攝像設備——也就是‘邊緣化人工智能技術’——發揮作用的的場景了。”
然而,在會議進行時收集數據有很大的優點。“假設有一位參會者是我們常說的沉默類型,”Kennedy解釋。“想象一下,如果系統能夠提示會議主講人注意到某個人一直保持沉默——他們可能比較害羞,需要一點鼓勵來推動他們分享想法。”
“我們探討‘會議中的平等’——確保每個人都能看見和被看見——這通常被視為是視覺層面的問題,但是能夠雙向聆聽,或協助創造和分享能力也同樣重要。”
特色產品

Automate VX
Automate VX采用多個光學變焦攝像頭和語音激活切換技術,保證遠程參與者能清晰地看清房間中的每個人,并且現場參與者永遠不必考慮應該看向哪里以跟隨對話。

全新的1 Beyond攝像頭 — 清晰捕捉房間內的每一個人
快思聰推出了一系列新款“1 Beyond™”攝像頭,專為清晰捕捉房間內每位參與者而設計——甚至包括那些距離鏡頭最遠60英寸的人。

快思聰Flex視頻會議與智能視頻技術
視頻會議室是當今現代混合辦公環境的核心。為了實現真正的協作,無論是現場或遠程會議人員,都必須能平等且充分參與。這正是快思聰Flex視頻會議與智能視頻技術被設計出的初衷——為無論身在何處的每個人提供更包容、更具吸引力和更公平的體驗。
