多方式人臉識別系統 微軟借此使設備更智能
來(lái)源:數字音視工程網(wǎng) 編輯:航行150 2015-12-08 17:01:55 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
“人臉識別”,一提到這個(gè)名詞,大家直觀(guān)印象大概是馬云在德國CeBIT上演示“刷臉支付”,引爆了全世界。此后中國資本大佬聞風(fēng)而動(dòng),紛紛布局“人臉識別”產(chǎn)業(yè)。但是對于人臉識別究竟是什么你真的了解嗎?
多方式人臉識別系統 微軟借助此使設備更智能(圖片自百度)
人臉識別方式多種多樣
其實(shí)看似高大尚德的人臉識別方式就是根據面部特征進(jìn)行的計算機系統識別,根據不同的特征也有多種識別方式。以下介紹幾種:
(1)幾何特征的人臉識別方法
幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識別速度快,需要的內存小,但識別率較低。
(2)基于特征臉(PCA)的人臉識別方法
特征臉?lè )椒ㄊ腔贙L變換的人臉識別方法,KL變換是圖像壓縮的一種最優(yōu)正交變換。高維的圖像空間經(jīng)過(guò)KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線(xiàn)性空間。如果假設人臉在這些低維線(xiàn)性空間的投影具有可分性,就可以將這些投影用作識別的特征矢量,這就是特征臉?lè )椒ǖ幕舅枷?。這些方法需要較多的訓練樣本,而且完全是基于圖像灰度的統計特性的。目前有一些改進(jìn)型的特征臉?lè )椒ā?/p>
(3)神經(jīng)網(wǎng)絡(luò )的人臉識別方法
神經(jīng)網(wǎng)絡(luò )的輸入可以是降低分辨率的人臉圖像、局部區域的自相關(guān)函數、局部紋理的二階矩等。這類(lèi)方法同樣需要較多的樣本進(jìn)行訓練,而在許多應用中,樣本數量是很有限的。
(4)彈性圖匹配的人臉識別方法
彈性圖匹配法在二維的空間中定義了一種對于通常的人臉變形具有一定的不變性的距離,并采用屬性拓撲圖來(lái)代表人臉,拓撲圖的任一頂點(diǎn)均包含一特征向量,用來(lái)記錄人臉在該頂點(diǎn)位置附近的信息。該方法結合了灰度特性和幾何因素,在比對時(shí)可以允許圖像存在彈性形變,在克服表情變化對識別的影響方面收到了較好的效果,同時(shí)對于單個(gè)人也不再需要多個(gè)樣本進(jìn)行訓練。
(5)線(xiàn)段Hausdorff距離(LHD)的人臉識別方法
心理學(xué)的研究表明,人類(lèi)在識別輪廓圖(比如漫畫(huà))的速度和準確度上絲毫不比識別灰度圖差。LHD是基于從人臉灰度圖像中提取出來(lái)的線(xiàn)段圖的,它定義的是兩個(gè)線(xiàn)段集之間的距離,與眾不同的是,LHD并不建立不同線(xiàn)段集之間線(xiàn)段的一一對應關(guān)系,因此它更能適應線(xiàn)段圖之間的微小變化。實(shí)驗結果表明,LHD在不同光照條件下和不同姿態(tài)情況下都有非常出色的表現,但是它在大表情的情況下識別效果不好。
(6)支持向量機(SVM)的人臉識別方法
近年來(lái),支持向量機是統計模式識別領(lǐng)域的一個(gè)新的熱點(diǎn),它試圖使得學(xué)習機在經(jīng)驗風(fēng)險和泛化能力上達到一種妥協(xié),從而提高學(xué)習機的性能。支持向量機主要解決的是一個(gè)2分類(lèi)問(wèn)題,它的基本思想是試圖把一個(gè)低維的線(xiàn)性不可分的問(wèn)題轉化成一個(gè)高維的線(xiàn)性可分的問(wèn)題。通常的實(shí)驗結果表明SVM有較好的識別率,但是它需要大量的訓練樣本(每類(lèi)300個(gè)),這在實(shí)際應用中往往是不現實(shí)的。而且支持向量機訓練時(shí)間長(cháng),方法實(shí)現復雜,該函數的取法沒(méi)有統一的理論。
人臉識別的方法很多,當前的一個(gè)研究方向是多方法的融合,以提高識別率。
微軟開(kāi)發(fā)人臉識別應用
12月4日,據美國福布斯報道,微軟牛津計作為一個(gè)軟件應用開(kāi)發(fā)項目,正處于向程序員開(kāi)放測試階段。這些工具擬讓開(kāi)發(fā)者開(kāi)發(fā)智能應用,探測人的面部情緒:開(kāi)心、傷心、憤怒、失望等。按照微軟的說(shuō)法,“在人臉識別等這些實(shí)例中,系統接收幾組圖片進(jìn)行學(xué)習,能學(xué)習并識別某些特征,然后這些信息會(huì )被應用于識別新接收的圖片中的面部特征。”
借助人臉識別,把應用做得更智能
為什么要如此煞費苦心?答案還是在智能二字上。我們要在自己的設備上做出“智能應用”。我們要把應用做到能感知位置、時(shí)間,甚至還有動(dòng)態(tài)(感知是否有動(dòng)作發(fā)生)——那為什么不做情緒感知?
如果你手上的智能手機知道你現在不開(kāi)心,難道你不想聽(tīng)一首你最喜歡的歌曲嗎,或者至少也能主動(dòng)給你提供這樣的選擇?如果你的智能手機智能你很疲憊(通過(guò)面部識別和加速計的運動(dòng)追蹤),難道你不想手機自動(dòng)給你一些打車(chē)回家的建議或選擇嗎?
微軟劍橋研究院院長(cháng)克里斯·畢曉普(Chris Bishop),在一場(chǎng)大會(huì )上展示了最新的情緒識別技術(shù)。微軟技術(shù)和研究團隊表示,牛津項目是微軟在人工智能和視聽(tīng)說(shuō)解技術(shù)方面總投資的一部分。
“從開(kāi)發(fā)者角度來(lái)說(shuō),我們想點(diǎn)亮他們的想象力,證明開(kāi)發(fā)一個(gè)智能應用是不難的,只要使用牛津項目和Azure服務(wù)。對那些想把應用做得更智能和更差異化的開(kāi)發(fā)者,這些服務(wù)能讓他們跨越不同的平臺,僅用3行代碼就能把智能技術(shù)注入應用當中,自身也不需要是人工智能方面的專(zhuān)家(例如無(wú)機器學(xué)習方面專(zhuān)業(yè)知識)。微軟將繼續改進(jìn)項目模型,開(kāi)發(fā)者無(wú)需更換代碼。”
評論comment