DAV首頁(yè)
數字音視工程網(wǎng)

微信公眾號

數字音視工程網(wǎng)

手機DAV

null
null
null
卓華,
null
null
null
null
null
null

我的位置:

share

AI之于音視頻應用的三問(wèn)三答

來(lái)源:快思聰Crestron        編輯:ZZZ    2024-07-05 15:16:55     加入收藏

在快思聰,我們的人工智能解決方案集成1 Beyond智能攝像頭和快思聰Automate VX語(yǔ)音激活追蹤技術(shù)等一系列揚聲器解決方案。

  AI人工智能是當今社會(huì )熱門(mén)話(huà)題。正面報道盛贊它為一位出色的虛擬助手,而負面聲音則擔憂(yōu)孩子們可能過(guò)于依賴(lài)它來(lái)完成學(xué)業(yè)。更令人不安的是,一些悲觀(guān)的預言警告說(shuō),未來(lái)機器人不僅可能取代人類(lèi)的工作崗位,還可能帶來(lái)致命的威脅。

  盡管這項技術(shù)本身既有巨大可能也有潛在危險,但最好記住,人工智能只是一款可以被用于極好目的的工具。

  尤其在現代混合辦公環(huán)境中所采用的視聽(tīng)系統里,這一點(diǎn)顯得極為貼切。

  “在快思聰,我們的人工智能解決方案集成1 Beyond智能攝像頭和快思聰Automate VX語(yǔ)音激活追蹤技術(shù)等一系列揚聲器解決方案。這些產(chǎn)品利用‘視覺(jué)人工智能’技術(shù),為用戶(hù)提供卓越的視頻會(huì )議體驗,并能與Microsoft Teams® Rooms和Zoom Rooms®軟件等平臺無(wú)縫協(xié)作,充分發(fā)揮各自的人工智能技術(shù)優(yōu)勢。”

 

  這究竟意味著(zhù)什么?讓我們通過(guò)回答三個(gè)最常見(jiàn)的問(wèn)題來(lái)逐一解析:

  什么是“視覺(jué)人工智能”,它與智能視頻有何不同?

  我們需要哪些硬件設備?

  使用系統時(shí),我需要關(guān)注哪些問(wèn)題?

 

  | 什么是“視覺(jué)人工智能”,它與智能視頻有何不同?

  您可能已經(jīng)注意到“智能視頻”與“視覺(jué)人工智能”被交替使用。更準確地界定這兩個(gè)概念的方法是:視覺(jué)人工智能是實(shí)現智能視頻體驗所必需的關(guān)鍵技術(shù)。其結果是,該系統能夠給予面部和動(dòng)作檢測自動(dòng)追蹤并定位房間中的演講者——這在包含遠程參與者的會(huì )議中極為重要。您希望那些虛擬與會(huì )者能看到會(huì )議室中人員的手勢和表情。當遠程工作者能夠捕捉到所有這些非語(yǔ)言信號時(shí),他們的參與度會(huì )得到增強。

  快思聰在智能視頻領(lǐng)域的產(chǎn)品管理總監Rony Sebok,為在線(xiàn)出版物《AI for All》撰寫(xiě)的一篇文章可以很好地解釋這項技術(shù)的強大能力:

  視覺(jué)人工智能可用于創(chuàng )造多樣性體驗,包括“團體構圖”(調整畫(huà)面以顯示所有參與者)、“自動(dòng)構圖”(當一個(gè)人講話(huà)時(shí)調整畫(huà)面)、以及“演講者追蹤”(隨演講者的動(dòng)作而在空間中移動(dòng))。它還可以進(jìn)一步在房間中自動(dòng)切換活躍的發(fā)言者(“發(fā)言者追蹤”),將房間的多個(gè)視角合并為單一視頻流等。

  就像其它人工智能實(shí)例一般,視覺(jué)人工智能正在逐漸發(fā)展完善。“人工智能已經(jīng)運用至統一通信中一段時(shí)間了,但現在我們正在開(kāi)發(fā)更加高效的‘智能場(chǎng)景控制盒’解決方案,”快思聰市場(chǎng)高級總監Sam Kennedy表示。人工智能也被應用于音頻解決方案中,它能夠屏蔽多余的噪音,甚至可以通過(guò)聲音來(lái)識別人。

  不久之后,人工智能將輔助這些系統實(shí)現“環(huán)境智能感知”——換言之,對空間進(jìn)行更深入的信息收集。“這些程序正在學(xué)習判斷房間內是否配備白板,并調整系統攝像頭以確保所有遠程參與者都能清晰地看見(jiàn)白板,”Kennedy指出。“未來(lái),人工智能還將能夠識別白板——甚至整個(gè)會(huì )議室——是否需要為下一場(chǎng)會(huì )議進(jìn)行清潔整理。”

  系統將能夠收集更多的環(huán)境信息,Kennedy表示:“是否需要在進(jìn)行演示時(shí)降低窗簾?當系統感應到房間內滿(mǎn)員時(shí),是否需要調節溫度?”最終,人工智能將能對遠程與現場(chǎng)的場(chǎng)地體驗兩者都產(chǎn)生影響。

 

  | 我們需要哪些硬件設備?

  硬件設備的配置選項有很多?;A級解決方案常見(jiàn)于配備多個(gè)攝像頭的視頻會(huì )議條,這些攝像頭能夠實(shí)現在發(fā)言者之間自動(dòng)切換。對于專(zhuān)為高端會(huì )議空間設計的大型系統,可以采用搭載智能視頻技術(shù)的攝像頭進(jìn)行驅動(dòng),或與基于麥克風(fēng)信號來(lái)追蹤發(fā)言人的解決方案相結合,以便自動(dòng)跟隨演講者或對話(huà)。

  快思聰可以提供所有選項配置,包括我們的1 Beyond智能PTZ攝像頭,它具備光學(xué)變焦功能,能夠清晰捕捉房間內每位參與者的影像——即使是那些距離鏡頭60英尺遠的人。光學(xué)變焦在攝像頭的光學(xué)鏡頭內部發(fā)生,而數字變焦則是通過(guò)放大和裁剪圖像來(lái)實(shí)現特寫(xiě)效果。后者會(huì )降低圖像的像素精度,隨著(zhù)放大倍數的增加,清晰度也隨之會(huì )降低,削弱了攝像頭捕捉關(guān)鍵非語(yǔ)言信號的能力。

  另一個(gè)選擇是快思聰的Automate VX語(yǔ)音激活的發(fā)言人追蹤解決方案。該系統與較大空間的適配性最高,因為您可以同時(shí)配置12個(gè)攝像頭來(lái)處理重要會(huì )議空間的需求。

  我們的目標是通過(guò)視覺(jué)人工智能技術(shù)實(shí)現流暢追蹤與合理構圖,提供清晰的特寫(xiě)畫(huà)面和多角度視圖,使遠程參與者得以體驗卓越的廣播級視頻品質(zhì)。Automate VX解決方案能夠自動(dòng)構圖并將發(fā)言人置于畫(huà)面中心,即便他們移出最初的位置。這樣,參與者便可自由活動(dòng),無(wú)需擔心自己是否會(huì )離開(kāi)攝像頭的拍攝范圍。

  Automate VX解決方案還具有“重構圖”功能,可自動(dòng)將人物置于鏡頭畫(huà)面中心。人工智能在此發(fā)揮關(guān)鍵作用,它能夠識別動(dòng)作幅度的大小。Kennedy解釋道:“例如,如果有人輕微地調整坐姿,人工智能不會(huì )認為需要重新調整鏡頭畫(huà)面構圖。”這減少了不必要的攝像頭移動(dòng),有助于避免頻繁或持續性晃動(dòng)而讓觀(guān)看者感到眩暈。

 

  | 使用系統時(shí),我需要關(guān)注哪些問(wèn)題?

  簡(jiǎn)單來(lái)說(shuō):隱私和安全是需要持續關(guān)注的動(dòng)態(tài)目標

  在隱私保護方面,視覺(jué)人工智能(Visual AI)通常不會(huì )引發(fā)警覺(jué),直到它開(kāi)始識別特定個(gè)人。這種識別功能涉及的不僅僅是視覺(jué)上的追蹤,還包括其他方面。比如,如果人工智能程序識別了您的面容,這是否侵犯了您的隱私?程序分析并報告會(huì )議中的“情緒”,其倫理問(wèn)題又該如何界定?人工智能是否能“領(lǐng)會(huì )”諷刺意味——它能否分辨出玩笑與真正具有負面影響的評論之間的區別?

  Kennedy表示,所有系統的默認選項應該是允許用戶(hù)“選擇退出”。“我認為,只有征詢(xún)人們是否同意被識別和追蹤才符合倫理道德,特別是對于生成性人工智能或虛擬助手程序,”他指出。“如果用戶(hù)同意,他們可以通過(guò)點(diǎn)擊按鈕立即選擇加入。”同時(shí),他又提到地方法律也在應對這一問(wèn)題:“在美國的一些州以及全球的許多地方,都明確禁止使用人工智能程序在環(huán)境中識別個(gè)人。”

  考慮到安全性問(wèn)題,在某些特定環(huán)境中將數據上傳至云端是不被允許的。“在信息被政府或企業(yè)視為機密的情況下,您是不會(huì )希望人工智能將任何數據發(fā)送至外部的,” Kennedy說(shuō)。“這正是集成了人工智能的攝像設備——也就是‘邊緣化人工智能技術(shù)’——發(fā)揮作用的的場(chǎng)景了。”

  然而,在會(huì )議進(jìn)行時(shí)收集數據有很大的優(yōu)點(diǎn)。“假設有一位參會(huì )者是我們常說(shuō)的沉默類(lèi)型,”Kennedy解釋。“想象一下,如果系統能夠提示會(huì )議主講人注意到某個(gè)人一直保持沉默——他們可能比較害羞,需要一點(diǎn)鼓勵來(lái)推動(dòng)他們分享想法。”

  “我們探討‘會(huì )議中的平等’——確保每個(gè)人都能看見(jiàn)和被看見(jiàn)——這通常被視為是視覺(jué)層面的問(wèn)題,但是能夠雙向聆聽(tīng),或協(xié)助創(chuàng )造和分享能力也同樣重要。”

 

  特色產(chǎn)品

 

  Automate VX

  Automate VX采用多個(gè)光學(xué)變焦攝像頭和語(yǔ)音激活切換技術(shù),保證遠程參與者能清晰地看清房間中的每個(gè)人,并且現場(chǎng)參與者永遠不必考慮應該看向哪里以跟隨對話(huà)。

  

 

  全新的1 Beyond攝像頭 — 清晰捕捉房間內的每一個(gè)人

  快思聰推出了一系列新款“1 Beyond™”攝像頭,專(zhuān)為清晰捕捉房間內每位參與者而設計——甚至包括那些距離鏡頭最遠60英寸的人。

 

  快思聰Flex視頻會(huì )議與智能視頻技術(shù)

  視頻會(huì )議室是當今現代混合辦公環(huán)境的核心。為了實(shí)現真正的協(xié)作,無(wú)論是現場(chǎng)或遠程會(huì )議人員,都必須能平等且充分參與。這正是快思聰Flex視頻會(huì )議與智能視頻技術(shù)被設計出的初衷——為無(wú)論身在何處的每個(gè)人提供更包容、更具吸引力和更公平的體驗。

免責聲明:本文來(lái)源于快思聰Crestron,本文僅代表作者個(gè)人觀(guān)點(diǎn),本站不作任何保證和承諾,若有任何疑問(wèn),請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。
掃一掃關(guān)注數字音視工程網(wǎng)公眾號

相關(guān)閱讀related

評論comment

 
驗證碼:
您還能輸入500
    国产av福利久久精品can动漫|2021精品国产自在现线|亚洲无线观看国产高清|欧洲人妻丰满av无码久久不卡|欧美情侣性视频