音頻監控系統在安防領(lǐng)域將大有可為
來(lái)源:數字音視工程網(wǎng) 編輯:航行150 2016-11-22 11:14:57 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
在安防領(lǐng)域,音頻系統早已是安全防范系統的重要組成部分。雖然超過(guò)70%的網(wǎng)絡(luò )攝像機 擁有單向或多向的音頻功能,但真正實(shí)際應用音頻功能的監控攝像機卻很少。對未來(lái)音頻監控市場(chǎng)的分析認為,會(huì )保持穩步增長(cháng)的趨勢,增幅會(huì )在10%左右。IHS預測未來(lái)音頻功能將在視頻監控 系統中得到更多的重視。
在很多事件中,我們調取錄像資料,發(fā)現只有畫(huà)面沒(méi)有聲音,一切只靠當事人的口供,無(wú)疑給公安機關(guān)偵破案件帶來(lái)障礙,公眾的質(zhì)疑很難避免。加裝音頻監控無(wú)疑將會(huì )解決質(zhì)疑的問(wèn)題并且增加證據的說(shuō)服力。
因此,現在很多的智慧安防系統,已經(jīng)要求增加音頻采集,例如在平安城市、公檢法辦案區、金融機構、公共交通 、教育監考、行政服務(wù)、執法取證等領(lǐng)域,越來(lái)越多的優(yōu)質(zhì)項目需要高清晰、高保真的音視頻同步監控系統,在優(yōu)質(zhì)安防工程中已凸顯出音頻監控的重要性。
聲紋識別
音頻監控經(jīng)過(guò)多年的發(fā)展,已經(jīng)可以做到通過(guò)聲音的識別來(lái)判斷說(shuō)話(huà)人的情緒、所處的環(huán)境等問(wèn)題。而在音頻監控環(huán)節中,聲紋識別提供了重要的技術(shù)支撐。
聲紋識別屬于生物識別 技術(shù)的一種,是一項根據語(yǔ)音波形中反映說(shuō)話(huà)人生理和行為特征的語(yǔ)音參數,自動(dòng)識別說(shuō)話(huà)人身份的技術(shù)。這里需要強調的是,和語(yǔ)音識別不同,聲紋識別利用的是語(yǔ)音信號中的說(shuō)話(huà)人信息,而不考慮語(yǔ)音中的字詞意思,它強調說(shuō)話(huà)人的個(gè)性,而語(yǔ)音識別的目的是識別出語(yǔ)音信號中的言語(yǔ)內容,并不考慮說(shuō)話(huà)人是誰(shuí),它強調共性。
同時(shí),與其他生物識別相比,聲紋識別的應用有一些特殊的優(yōu)勢:(1)蘊含聲紋特征的語(yǔ)音獲取方便、自然,聲紋提取可在不知不覺(jué)中完成,因此使用者的接受程度也高;(2)獲取語(yǔ)音的識別成本低廉,使用簡(jiǎn)單,一個(gè)麥克風(fēng)即可,在使用通訊設備時(shí)更無(wú)需額外的錄音設備;(3)適合遠程身份確認,只需要一個(gè)麥克風(fēng)或電話(huà)、手機就可以通過(guò)網(wǎng)路(通訊網(wǎng)絡(luò )或互聯(lián)網(wǎng)絡(luò ))實(shí)現遠程登錄;(4)聲紋辨認和確認的算法復雜度低;(5)配合一些其他措施,如通過(guò)語(yǔ)音識別進(jìn)行內容鑒別等,可以提高準確率。
這些優(yōu)勢使得聲紋識別的應用越來(lái)越受到系統開(kāi)發(fā)者和用戶(hù)青睞,聲紋識別的世界市場(chǎng)占有率15.8%,僅次于指紋和掌紋的生物特征識別,并有不斷上升的趨勢。
聲音定位
人們經(jīng)常借助聽(tīng)覺(jué)來(lái)判斷發(fā)音物體的位置。例如,當你獨自行走時(shí),突然聽(tīng)到一個(gè)響聲,你會(huì )立刻判斷出這個(gè)聲音是什么聲音、對你有無(wú)威脅、它來(lái)自何方等等。確定聲音的方向和距離需要比較來(lái)自?xún)啥畔?,雖然你會(huì )很快做判斷和反應,但聲音定位過(guò)程是聽(tīng)覺(jué)系統復雜綜合的功能。而聲音定位則是通過(guò)強度差、時(shí)間差、因色差、相位差等來(lái)實(shí)現。
音頻場(chǎng)景分析
作為人們感知外界環(huán)境的一個(gè)重要通道,聽(tīng)覺(jué)在視線(xiàn)障礙、不利光照條件等情況中可起到視覺(jué)無(wú)法替代的作用,是視覺(jué)的重要補充。相比于圖像數據,音頻信號往往可使用相對簡(jiǎn)單的設備進(jìn)行采集并且占用更少的存儲空間和處理時(shí)間。隨著(zhù)當前移動(dòng)平臺計算能力的不斷提高,出現了越來(lái)越多基于音頻的各類(lèi)應用,所涉及的音頻處理算法一直是相關(guān)研究領(lǐng)域的重點(diǎn)。
其中,提取、分析和有效利用音頻數據所攜帶的語(yǔ)義信息,對基于內容的多媒體檢索、摘要以及開(kāi)發(fā)上下文自適應的應用等具有重要意義。音頻場(chǎng)景分析主要是為了分析、決策、預警所監聽(tīng) 環(huán)境下發(fā)生的異常行為。其核心技術(shù)是基于各類(lèi)異常聲音在時(shí)域、頻域的特征,結合模式識別的分類(lèi)方法對異常事件報警 。
語(yǔ)音識別
與機器進(jìn)行語(yǔ)音交流,讓機器明白你說(shuō)什么,這是人們長(cháng)期以來(lái)夢(mèng)寐以求的事情。語(yǔ)音識別技術(shù)就是讓機器通過(guò)識別和理解過(guò)程把語(yǔ)音信號轉變?yōu)橄鄳奈谋净蛎畹母呒夹g(shù)。語(yǔ)音識別技術(shù)經(jīng)過(guò)幾十年的發(fā)展,基于深度學(xué)習的人工智能 語(yǔ)音將得到大范圍的應用。
音頻監控在安防領(lǐng)域大有可為
由于傳統視頻監控系統,受攝像機鏡頭 和安裝角度限制,監控區域很難做到無(wú)死角覆蓋,即使通過(guò)多角度安裝攝像機,也無(wú)法保證全覆蓋,由于攝像機圖像采集受諸多環(huán)境因素(例如:現場(chǎng)照明、強光源干擾等)影響而無(wú)法有效采集現場(chǎng)圖像。而音頻監控技術(shù)由于音頻本身的技術(shù)特性,基本上不存監控死角,能更有效的掌控現場(chǎng)的實(shí)時(shí)情況。所以音頻監控技術(shù)越來(lái)可以更好的彌補視頻監控技術(shù)的不足。
同時(shí),聲音具有一系列獨有的特征,如不受白天和黑夜的影響,不容易遮擋,具有方向性等等。在球機上安置拾音器,對聲音的方向進(jìn)行定位,當檢測到異常聲音時(shí)控制球機到相應位置,這樣一來(lái),在一定程度上就可以第一時(shí)間看到異常聲音所處位置的實(shí)時(shí)視頻,為判定事態(tài)提供了多種信息。(本文部分技術(shù)支持來(lái)源于快魚(yú)電子)
人工智能時(shí)代,語(yǔ)音技術(shù)以及和語(yǔ)音技術(shù)相關(guān)的應用、圖像技術(shù)以及相關(guān)應用在今天變得格外重要。而圍繞著(zhù)語(yǔ)音、圖像以及其他傳感器所產(chǎn)生的數據,以及這些數據的生產(chǎn)、分析、組織和消費,在之后的很長(cháng)的時(shí)間里,注定會(huì )成為智能領(lǐng)域中最重要的發(fā)展方向。我們期待智能音頻帶給安防的巨大變化。
評論comment