DAV首頁(yè)
數字音視工程網(wǎng)

微信公眾號

數字音視工程網(wǎng)

手機DAV

null
null
null
卓華,
招商,
null
null
null
快捷,
null

我的位置:

share

人臉識別技術(shù)發(fā)展與展望(雜志)

來(lái)源:數字音視工程網(wǎng)        編輯:數字音視工程    2016-04-21 10:03:34     加入收藏    咨詢(xún)

咨詢(xún)
所在單位:*
姓名:*
手機:*
職位:
郵箱:*
其他聯(lián)系方式:
咨詢(xún)內容:
驗證碼:
不能為空 驗證碼錯誤
確定

  前言

  2015年以來(lái),人臉識別相關(guān)新聞頻頻進(jìn)入人們的視野,國內外的人臉識別算法團隊不斷刷新著(zhù)各種記錄,相關(guān)的產(chǎn)品與應用也層出不窮,使得人臉識別成為近期最受關(guān)注的生物特征識別技術(shù)。

  人臉識別作為一種生物特征識別技術(shù),早期主要應用于公共安全領(lǐng)域,隨著(zhù)近年來(lái)人臉考勤、人臉通過(guò)等應用的普及,普通人逐漸接觸到以前在科幻片中才能看到的技術(shù)。尤其是近兩年,隨著(zhù)技術(shù)的進(jìn)步,人臉識別在各個(gè)領(lǐng)域取得越來(lái)越多的應用:馬云在德國演示了刷臉支付、微軟的How-Old.net測年齡刷爆朋友圈、銀行券商逐漸采用人臉識別技術(shù)輔助開(kāi)戶(hù)。本文旨在回顧人臉識別技術(shù)的發(fā)展歷程,同時(shí)結合個(gè)人的觀(guān)察與總結,展望人臉識別的未來(lái)趨勢。

  人臉識別技術(shù)簡(jiǎn)介

  完整的人臉識別系統一般包括人臉檢測、人臉配準、人臉匹配、人臉屬性分析等模塊。

  人臉檢測:從圖片中獲得人臉的位置,目前常用的是AdaBoost級聯(lián)分類(lèi)器。

  人臉配準:在人臉圖像中獲得關(guān)鍵特征點(diǎn)(比如眼睛、鼻子、嘴巴)的位置,通常采用回歸的方法。

  人臉匹配。人們常說(shuō)的“人臉識別”通常指的是人臉匹配,包括兩種模式:鑒別(identification)與認證(verification)。人臉鑒別給出測試人員的身份,即解決”你是誰(shuí)”的問(wèn)題,比如公安追逃系統;人臉認證用于判斷測試人員與其聲稱(chēng)的身份是否一致,即驗證“你是你”的問(wèn)題,比如刷臉支付。目前主流的方法有兩種,一是通過(guò)人工設計特征+子空間投影實(shí)現,二是采用深度學(xué)習算法。

  人臉屬性分析。根據人臉?lè )治龀龈鞣N屬性,比如年齡,性別,表情,種族,發(fā)型,是否戴眼鏡,胡子的類(lèi)型。通常采用一般的分類(lèi)或者回歸技術(shù)。

  人臉識別技術(shù)進(jìn)展

  自動(dòng)人臉識別系統的研究始于20世紀中期,早期的人臉識別探索主要依靠一些手工標定的幾何特征(比如眼鏡、嘴巴等器官的位置、距離)進(jìn)行分類(lèi),實(shí)用的成果較少。

  1991年發(fā)表的EigenFaces是一種重要的方法,該方法通過(guò)主成分分析(PCA)將圖像投影到一個(gè)低維的“特征空間”,使得信息損失最少,在該“特征空間”上進(jìn)行人臉?lè )诸?lèi)。該方法不僅對數據進(jìn)行了壓縮,而且識別效果比直接使用圖像像素也要好。EigenFaces將統計學(xué)習引入到人臉識別領(lǐng)域,直接影響了后續的一大類(lèi)主流識別算法,即子空間方法,該類(lèi)方法通過(guò)各種各樣準則來(lái)尋找“特征空間”,使得在“特征空間”上分類(lèi)準確率更高,比如FisherFaces。與EigenFaces不同的是,在訓練階段FisherFaces引入了監督信息,投影的不標不再是“信息損失最少”,而是“同類(lèi)分布越緊,不同類(lèi)分布越散”,即更容易分類(lèi),在有足夠帶標簽樣本的情況下,該方法可以獲得更好的識別效果。1990年代,美國國防部反毒品技術(shù)發(fā)展計劃辦公室資助了FERET(Face Recognition Technology Test)項目,構建了數據庫對自動(dòng)人臉識別算法進(jìn)行對比,在1996年最后一次FERET測試中,子空間方法取得了領(lǐng)先的測試結果。時(shí)至今日,子空間方法仍然發(fā)揮著(zhù)非常重要的作用,不僅直接應用于許多人臉識別系統,而且許多人臉識別的新方向比如流形學(xué)習、稀疏表示、度量學(xué)習,都或多或少的受到子空間方法的影響。

  盡管子空間方法在FERET的一些簡(jiǎn)單測試集合上取得了不錯的效果,但是當測試集呈現出光照、姿態(tài)等變化時(shí),子空間人臉識別算法的性能急劇下降,因此在進(jìn)入21世紀后,人臉識別研究者們將更多的精力放在提高算法的魯棒性上面。子空間方法在非理想測試條件下性能下降的一個(gè)重要原因就是,原始的圖像像素包含了諸多不利于識別的信息,比如光照。研究人員主要有兩種思路來(lái)應對這些不利因素:一是進(jìn)行專(zhuān)門(mén)的校正(去光照以降低光照的影響;3D校正以降低姿態(tài)的影響),二是尋找更加魯棒的特征。魯棒的特征是目前很多識別算法的基礎,其中比較常用的有Gabor特征、LBP特征。在21世紀的前10年里,研究人員結合魯棒特征與子空間算法提出各種各樣的改進(jìn),使得人臉識別算法的性能得到不斷的提升,見(jiàn)圖1。人臉識別逐漸在一些場(chǎng)景中得以實(shí)用,比如人臉考勤機、自助通關(guān)。

  圖1 NIST人臉測試歷程

  盡管在一些測試集合上,魯棒特征+子空間的方法已經(jīng)取得了非常高的準確率,但是在實(shí)際場(chǎng)景中,人臉識別性能仍然難以滿(mǎn)足要求?,F實(shí)環(huán)境下光照、姿態(tài)、清晰度等遠遠比實(shí)驗室采集的測試圖片復雜的多。2007年LFW數據集被建立,該數據集旨在評價(jià)非約束場(chǎng)景下的人臉識別性能。由于該數據集包含復雜的姿態(tài)、表情、遮擋等變化,而且又沒(méi)有充足的訓練樣本,很多算法并不能取得很高的準確率,在2010左右最好的算法也只有85%左右的準確率。研究者們發(fā)現,要想取得好的效果,準確的特征點(diǎn)定位、適當的學(xué)習算法以及大量的訓練樣本起到至關(guān)重要的作用。于是從2010年開(kāi)始,準確地特征點(diǎn)定位、高層特征表示與度量學(xué)習、收集更多的訓練樣本成為人臉識別研發(fā)的方向。一個(gè)代表性的算法就是微軟的HDLBP算法,該方法基于準確定位的特征點(diǎn)提取高維的人臉特征,以稀疏投影的方式進(jìn)行降維,最后通過(guò)一種度量學(xué)習算法來(lái)計算相似度,在LFW上取得了93%以上的準確率,此外,通過(guò)在大量的外部數據集上進(jìn)行訓練,準確率可進(jìn)一步提高到95%以上。2012年以后,隨著(zhù)深度學(xué)習的復興,研究人員自然而然的想到通過(guò)深度學(xué)習來(lái)解決人臉識別問(wèn)題。在剛開(kāi)始的一些嘗試中,深度學(xué)習在人臉識別中并沒(méi)有取得非常領(lǐng)先的結果,在2013年的CVPR上仍然落后于傳統方法。之后研究人員針對人臉識別的特點(diǎn)進(jìn)行了一系列的改進(jìn),而且通過(guò)互聯(lián)網(wǎng)收集到更多的訓練樣本,終于使得深度學(xué)習在人臉識別領(lǐng)域取得了不錯的結果。在2014年的CVPR上,Facebook、CUHK、Face++等通過(guò)深度學(xué)習在LFW上取得了97%以上的準確率,尤其是CUHK的湯曉鷗實(shí)驗室對其DeepID系列算法不斷改進(jìn),其DeepID2算法取得了99%以上的準確率,第一次使得算法的性能在LFW數據集上超過(guò)了人類(lèi)。

  據筆者統計,截止目前已經(jīng)有至少10個(gè)人臉識別團隊宣稱(chēng)自己的算法識別準確率(在LFW數據集上)超過(guò)99%,其中有百度、Google、騰訊這樣的互聯(lián)網(wǎng)巨頭,有Face++、Linkface等初創(chuàng )公司,也有香港中文大學(xué)、中科院、新加坡國立大學(xué)這樣的科研院所。這些團隊的結果都得益于深度學(xué)習算法。毫無(wú)疑問(wèn),深度學(xué)習成為目前人臉識別領(lǐng)域最主流的研究方向。

  人臉識別技術(shù)展望

  毫無(wú)疑問(wèn),深度學(xué)習成為目前人臉識別領(lǐng)域最主流的研究方向,但是傳統方法仍然可以取得不錯的效果。在大華股份內部,傳統非深度方法與深度學(xué)習都起到重要的作用。深度學(xué)習算法學(xué)習能力更強,在具備足夠多的訓練樣本的情況下,往往可以取得更高的準確率,但是目前的深度學(xué)習算法計算量一般都比較大,往往依賴(lài)于GPU等并行計算資源。非深度方法不僅速度快,而且在安防監控等復雜環(huán)境下更加穩定,比如在一個(gè)中國人日常生活照數據集上,大華的非深度學(xué)習算法可以超過(guò)某深度學(xué)習算法(該算法在LFW上準確率超過(guò)99%)。深度學(xué)習在未來(lái)一段時(shí)間內必將持續成為研究重點(diǎn)。同時(shí)傳統方法也不容忽視,尤其是在一些實(shí)用場(chǎng)景速度要求高、環(huán)境復雜而訓練數據又不充足的情況下。算法改進(jìn)、數據資源、計算資源將成為核心競爭力,尤其是數據資源,成為深度學(xué)習性能的關(guān)鍵因素。一定程度上可以說(shuō)誰(shuí)掌握了數據入口(尤其是特定領(lǐng)域的結構化數據),誰(shuí)就有機會(huì )做出真正的”終極應用”,例如大華股份專(zhuān)注于安防領(lǐng)域的人臉識別,針對安防監控采集、收集了大量結構化數據用于算法改進(jìn),取得了較好的效果。

  數據成為提升人臉識別算法性能的關(guān)鍵因素,很多應用更加關(guān)注低誤報條件下的識別性能,比如支人臉支付需要控制錯誤接受率在0.00001之內,因此以后的算法改進(jìn)也將著(zhù)重于提升低誤報下的識別率。對于安防監控而言,可能需要控制在0.00000001之內(比如幾十萬(wàn)人的注冊庫),目前學(xué)術(shù)界還沒(méi)有相關(guān)的數據庫可以測試如此低誤報下的識別性能,大華股份在內部已經(jīng)建立了千萬(wàn)級別的數據庫用于算法測試與改進(jìn)。

  人臉識別的應用展望與思考

  隨著(zhù)技術(shù)的日益進(jìn)步,人臉識別必將更多的走進(jìn)每個(gè)人的日常生活,比如越來(lái)越多的銀行與券商借助人臉識別進(jìn)行身份核實(shí),大大提高了工作效率;基于人臉識別的社保領(lǐng)取,方便了大批行動(dòng)不便的老人;證件照查重、嫌疑犯檢索協(xié)助公安機關(guān)破案。然而必須認識到的是,目前的人臉識別技術(shù)遠遠沒(méi)有達到足以應用到任意場(chǎng)景的程度,尤其是對安全性要求、識別率要求很高的場(chǎng)景下。過(guò)度宣傳“識別率達到99%” “識別率超過(guò)人類(lèi)”之類(lèi)的內容并不利于人臉識別的長(cháng)遠發(fā)展。首先,LFW只是一個(gè)很小的學(xué)術(shù)數據集,在上面達到99%以上的準確率并不代表在實(shí)用中可以達到很高的準確率,在更權威的數據集FRVT上,很多算法并沒(méi)有經(jīng)過(guò)測試,難以評價(jià)真正的性能。其次,人臉識別的很多問(wèn)題還沒(méi)有得到真正解決,比如刷臉支付下的活體驗證,現有的驗證機制很可能被視頻合成、3D頭套等破解,存在巨大風(fēng)險。

  總之,人臉識別歷經(jīng)數十年的發(fā)展,已經(jīng)取得了巨大的進(jìn)步,應用前景廣闊,但同時(shí)也面臨著(zhù)巨大的挑戰。通過(guò)學(xué)術(shù)界、工業(yè)界同仁持續的腳踏實(shí)地的努力,人臉識別必將取得更多的進(jìn)展。

免責聲明:本文來(lái)源于網(wǎng)絡(luò )收集,本文僅代表作者個(gè)人觀(guān)點(diǎn),本站不作任何保證和承諾,若有任何疑問(wèn),請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。(原創(chuàng )稿件未經(jīng)許可,不可轉載,轉載請注明來(lái)源)
掃一掃關(guān)注數字音視工程網(wǎng)公眾號

相關(guān)閱讀related

評論comment

 
驗證碼:
您還能輸入500
    国产av福利久久精品can动漫|2021精品国产自在现线|亚洲无线观看国产高清|欧洲人妻丰满av无码久久不卡|欧美情侣性视频