圖像識別技術(shù)在安防領(lǐng)域的應用研究
來(lái)源:數字音視工程網(wǎng) 編輯:merry2013 2016-03-18 07:09:34 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
近一兩年來(lái),人工智能領(lǐng)域得到了媒體界、產(chǎn)業(yè)界和學(xué)術(shù)界等前所未有的關(guān)注,機器正在越來(lái)越多的取代人類(lèi)特有的優(yōu)勢和技能,這其中最為重要的可能就是圖像識別技術(shù)。本文將從圖像識別技術(shù)的原理闡述出發(fā),介紹這一技術(shù)在安防行業(yè)的具體應用,并且闡述其在當前安防應用上碰到的困難。當然,面對這些困難,圖像識別技術(shù)將以此為契機,與安防技術(shù)實(shí)現更大范圍的融合與發(fā)展。
圖像識別技術(shù)與人工智能
說(shuō)起圖像識別,人類(lèi)的這一能力非常突出。圖形**作用于感覺(jué)器官,人們辨認出它是經(jīng)驗過(guò)的某一圖形,甚至能感知到與圖像距離或者形狀的改變,這一過(guò)程叫做圖像再認。在圖像識別中,既要有當時(shí)進(jìn)入感官的信息,也要有記憶中存儲的信息。只有通過(guò)存儲的信息與當前的信息進(jìn)行比較的加工過(guò)程,才能實(shí)現對圖像的再認。
計算機圖像識別技術(shù),則是利用計算機對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標和對象的技術(shù)。圖像識別所研究的問(wèn)題,是如何用計算機代替人類(lèi)去自動(dòng)處理大量的物理信息,解決人類(lèi)所無(wú)法識別或者識別過(guò)于耗費資源的問(wèn)題,從而很大程度上解放人類(lèi)的勞動(dòng)力。
圖像識別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。圖像識別技術(shù)是以圖像的主要特征為基礎的。每個(gè)圖像都有它的特征,對圖像識別時(shí)眼動(dòng)的研究表明,視線(xiàn)總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線(xiàn)也總是依次從一個(gè)特征轉到另一個(gè)特征上。由此可見(jiàn),在圖像識別過(guò)程中,知覺(jué)機制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負責整合信息的機制,它能把分階段獲得的信息整理成一個(gè)完整的知覺(jué)映象。
為了編制模擬人類(lèi)圖像識別活動(dòng)的計算機程序,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認為,識別某個(gè)圖像,必須在過(guò)去的經(jīng)驗中有這個(gè)圖像的記憶模式,又叫模板。當前的**如果能與大腦中的模板相匹配,這個(gè)圖像也就被識別了。但這種模型強調圖像必須與腦中的模板完全符合才能加以識別,有一定的局限性。格式塔心理學(xué)家又據此提出了一個(gè)原型匹配模型。這種模型認為,在長(cháng)時(shí)記憶中存儲的并不是所要識別的無(wú)數個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來(lái)的“相似性”就可作為原型,拿它來(lái)檢驗所要識別的圖像。如果能找到一個(gè)相似的原型,這個(gè)圖像也就被識別了。但是,這種模型沒(méi)有說(shuō)明人是怎樣對相似的刺 激進(jìn)行辨別和加工的,它也難以在計算機程序中得到實(shí)現。因此又有人提出了一個(gè)更復雜的模型,即“泛魔”識別模型。
隨著(zhù)計算機技術(shù)及人工智能技術(shù)的發(fā)展,圖像識別技術(shù)越來(lái)越成為人工智能的基礎技術(shù),它將是未來(lái)科技領(lǐng)域幾大關(guān)鍵產(chǎn)業(yè)的核心技術(shù)之一。微軟、谷歌、Facebook、亞馬遜、百度、騰訊等巨頭都在傾注大量資源推動(dòng)這項功能進(jìn)步。比如微軟的圖像識別應用“我看起來(lái)有多大”(How Old Do I Look?),成為網(wǎng)絡(luò )上紅極一時(shí)的話(huà)題。在去年舉行的第六屆ImageNet圖像識別技術(shù)比賽中,微軟憑借“圖像識別的深度殘差學(xué)習”(Deep Residual Learning for Image Recognition)系統獲得第一名??萍脊救绱藷嶂杂趫D像識別技術(shù)的應用和創(chuàng )新,這種進(jìn)步顯然會(huì )大大方便互聯(lián)網(wǎng)、傳媒行業(yè)及科研領(lǐng)域的相關(guān)工作。
圖像識別技術(shù)與安防技術(shù)的融合
現在,圖像識別技術(shù)的應用范圍已經(jīng)遠遠突破視覺(jué)的范圍,而更多地體現為機器智能、數字技術(shù)的特點(diǎn)??梢哉f(shuō),圖像識別技術(shù)就是人類(lèi)視覺(jué)認知的延伸。
視頻監控在過(guò)去的實(shí)際應用中,面臨的最大問(wèn)題就是必須由人工查看視頻。視頻智能分析技術(shù)正是為解決這一問(wèn)題而生,它通過(guò)對視頻進(jìn)行智能分析、有效信息的結構化數據提取,從而讓視頻監控的使用者真正告別人工安防而走進(jìn)自動(dòng)化安防的新時(shí)代。
目前視頻智能分析主要有兩種產(chǎn)品形態(tài):前端智能和后端智能。前端智能以科達感知型攝像機為代表,將智能分析算法嵌入到前端攝像機,前端攝像機對采集的視頻內容立即進(jìn)行分析,提取出畫(huà)面中關(guān)鍵的、感興趣的、有效的信息,形成結構化的數據,將后端感興趣的內容實(shí)時(shí)傳給后端做存儲或深入分析。后端智能是前端攝像機只負責采集視頻圖像,將碼流傳遞到后端服務(wù)器做集中處理。這樣對于后端的計算壓力比較大,也不利于實(shí)時(shí)處理。更合理的方式是前端攝像機進(jìn)行基礎的結構化數據提取,后端服務(wù)器再進(jìn)行深度二次分析;也就是說(shuō),將前端和后端配合起來(lái)做智能分析,才真正讓視頻圖像智能分析實(shí)現最大化價(jià)值。
視頻監控領(lǐng)域是圖像識別技術(shù)一直在尋求突破的主要領(lǐng)域之一。視頻智能分析技術(shù)目前在公安、交通、零售、司法、教育等行業(yè)都獲得了普及性應用。
公安
公安行業(yè)借助智能視頻分析主要用于實(shí)現城市道路、廣場(chǎng)及各類(lèi)重點(diǎn)場(chǎng)所的人、車(chē)、物等目標的識別,提取包括人的性別、人臉、全身等信息,車(chē)的車(chē)標、車(chē)牌、車(chē)身顏色等信息,這些信息均可提煉為計算機能識別的結構化數據,送入后端進(jìn)行專(zhuān)業(yè)的安全管理應用,主要包括實(shí)時(shí)布控、高危人員比對、以圖搜圖、多點(diǎn)碰撞、語(yǔ)義搜索等方面。
交通
具有分析、感知能力的智能攝像機通過(guò)視頻識別分析技術(shù),可對每輛車(chē)進(jìn)行完整的違法行為分析、識別、抓拍和錄像,記錄車(chē)輛違法的整個(gè)過(guò)程,再將每條記錄生成非結構化的視頻、照片數據和結構化的文本數據提交給后端智能管理與分析系統,由系統進(jìn)行高度智能的交通違法行為處理?;谥悄芤曨l分析技術(shù),智能交通管理系統還能得出不同品牌的車(chē)型擁有量、過(guò)車(chē)高峰期、車(chē)輛進(jìn)出城高峰期及行駛方向等豐富的交通數據,為城市交通流量管控、交通道路規劃等提供詳實(shí)的數據支撐。
零售
視頻智能分析在零售門(mén)店視頻監控方面的領(lǐng)先應用,是科達為聯(lián)合利華門(mén)店建設的熱點(diǎn)統計系統,系統通過(guò)感知型攝像機和后端的大數據分析平臺相配合,用于開(kāi)展個(gè)人護理類(lèi)商品陳列和貨架布局的顧客行為數據收集及分析,比如顧客在不同商品前的停留時(shí)間是多少、商品陳列和貨架布局調整前后的人流動(dòng)向對比和購買(mǎi)金額對比等,進(jìn)而作為最終的經(jīng)營(yíng)決策參考。這一系統不僅創(chuàng )新了視頻監控系統遠程管理零售門(mén)店的應用,更為連鎖零售行業(yè)如何通過(guò)視頻監控系統開(kāi)展消費數據比對、分析等大數據應用開(kāi)創(chuàng )了有益啟示。
司法和教育
在監獄和看守所,視頻智能分析技術(shù)更是較早得到了運用。除傳統的智能分析技術(shù)應用之外,感知型攝像機也被用在A(yíng)B門(mén)等出入口,用于對所有過(guò)往人員進(jìn)行臉部和全身的圖像采集,同時(shí)提供結構化和半結構化數據給后端管理平臺,平臺對人員進(jìn)行實(shí)時(shí)比對,用于有效杜絕非法出入。學(xué)校采用視頻智能分析技術(shù)可以開(kāi)展安全管理和教育錄播兩種應用,后者通過(guò)教室內的智能跟蹤攝像機自動(dòng)識別、跟蹤老師的運動(dòng)圖像,同時(shí)對視頻和聲音進(jìn)行記錄,再生成錄播課程。
應該說(shuō),圖像識別技術(shù)對于整個(gè)安防方案來(lái)說(shuō)都是一項艱巨而又關(guān)鍵的任務(wù),直接決定了后續圖像處理與分析的準確性和便捷性。在視頻監控領(lǐng)域,圖像識別技術(shù)正面臨著(zhù)不小的挑戰,具體可闡釋為:其一,對圖像質(zhì)量的要求越來(lái)越高,圖像識別與處理的算法也越來(lái)越復雜;其二,對圖像的實(shí)時(shí)性處理和傳輸要求越來(lái)越高;其三,圖像識別的算法更加個(gè)性化,也更加成為市場(chǎng)競爭力的關(guān)鍵所在;其四,圖像數據往往涉及隱私,因此也需要提供可以信任的安全保證。面對這些挑戰,科達深知要使圖像識別技術(shù)與安防技術(shù)實(shí)現更好的融合,任重而道遠。盡管在業(yè)界已經(jīng)擁有了一定的知名度,科達仍然深耕于安防行業(yè),把感知型攝像機視為視頻監控的未來(lái),在將圖像識別技術(shù)更好地應用于具體的行業(yè)需求方面,為其他人工智能的應用提供了一條有價(jià)值的參考路徑。
評論comment