解讀 云視鏈背后的“讀眼”技術(shù)
來(lái)源:數字音視工程網(wǎng) 作者:黃通兵 編輯:航行150 2015-07-30 15:19:42 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
今天整個(gè)科技圈都被云視鏈霸了屏,又是一個(gè)青年才俊創(chuàng )業(yè)的勵志故事,22歲就擁有哈佛大學(xué)高材生、創(chuàng )業(yè)公司CEO、6億估值、福布斯創(chuàng )業(yè)榜單最年輕創(chuàng )業(yè)者等諸多光環(huán),而透過(guò)這些光環(huán)我們該看一看云視鏈是否真的有看起來(lái)那么cool。
看看媒體是怎么說(shuō)的吧:
拋開(kāi)用戶(hù)在觀(guān)看視頻過(guò)程中是否愿意那么多的互動(dòng)(廣告)不說(shuō),今天主要探討一下,一聽(tīng)就覺(jué)得吊炸天的通過(guò)捕捉眼球信息來(lái)實(shí)現觀(guān)眾情緒和思維在視頻中的實(shí)時(shí)反饋互動(dòng)。
作為眼球追蹤行業(yè)的從業(yè)者,我的分析可能讓很多剛剛有點(diǎn)興奮的讀者失望了,從報道中所提到的云視鏈的技術(shù)來(lái)看,通過(guò)普通家用攝像頭捕捉人眼注視點(diǎn)可是沒(méi)那么容易實(shí)現的!
1、技術(shù)現狀
目前在世界范圍內眼球追蹤技術(shù)的實(shí)現主要是通過(guò)眼電圖法、鞏膜接觸鏡法、眼圖錄像法、角膜反射法。
眼電圖法應用較早,它是通過(guò)放置于眼鏡附近的電極測量皮膚的電勢差,實(shí)現眼動(dòng)測量。
眼電圖法在40年前就已經(jīng)廣泛應用,至今仍有部分領(lǐng)域使用此法測量。
鞏膜接觸鏡法是將光學(xué)部件置于一個(gè)接觸鏡上,并將接觸鏡輕置于眼球上,這種方法在5°范圍內可以達到5“~10”的精度,因此也是被認為精度最高的眼球追蹤法。但是因為操作精度高,并且對于人眼有一定的傷害因此并未廣泛應用。
以上兩種方法普及性太差,對于普通用戶(hù)來(lái)說(shuō)根本無(wú)法實(shí)現。
眼圖錄像法主要是通過(guò)辨認眼球的特征如瞳孔外形、異色邊緣(虹膜、虹膜邊界)、近距指向光源的角膜反射來(lái)實(shí)現眼動(dòng)跟蹤。
根據云視頻的宣傳,其所提到的能夠讀懂人“眼神意識”的視頻技術(shù),就是基于此項技術(shù),也就是眼圖錄像法。
2、技術(shù)實(shí)現的硬傷在哪里?
然而虹膜識別+瞳孔運動(dòng)識別雖然可以捕捉人眼的動(dòng)作,但是卻無(wú)法檢測到人眼的注視點(diǎn),這才是最大的硬傷!
首先,虹膜識別和瞳孔識別都是基于一個(gè)平面的,要測量注視點(diǎn)就必須保證頭部是固定的,讓眼睛同頭部和注視點(diǎn)的相對位置一致才可以。人眼作為人體最精細的器官之一,注視點(diǎn)轉移僅需要一個(gè)微小的動(dòng)作,而人類(lèi)僅僅因為呼吸而造成的頭部動(dòng)作就足以讓測量誤差造成定位偏移。
然后我們再退一萬(wàn)步講,即使的頭部是固定的,對于虹膜的識別也沒(méi)那么容易,歐洲人的人眼特征較為明顯,識別相對容易,但也不是一個(gè)家用普通攝像頭就可以判斷眼球特征的,而亞洲人瞳孔多為深褐色,人眼特征較弱,普通攝像頭幾乎無(wú)法捕捉。
因此從云視鏈的眼球追蹤技術(shù)的出發(fā)點(diǎn)來(lái)說(shuō),通過(guò)眼神就能推送出你想要的信息是無(wú)法實(shí)現的!
那么,云視鏈的視頻與觀(guān)眾眼神關(guān)注點(diǎn)的實(shí)時(shí)反饋也是根本無(wú)法實(shí)現的嗎?其實(shí)并非如此。
剛也已經(jīng)提到,云視鏈以虹膜識別+瞳孔運動(dòng)識別為出發(fā)點(diǎn)的,就是這個(gè)起點(diǎn)讓他們走錯了路。不知道有沒(méi)有細心的讀者注意到,其實(shí)眼球追蹤技術(shù)的實(shí)現還有一種方法我沒(méi)有說(shuō)?那就是角膜反射法。接下來(lái)就介紹一下這種可以通過(guò)普通攝像頭即可捕捉人眼注視點(diǎn)的方法,搬好板凳,買(mǎi)好瓜子。
角膜反射法是目前眼球追蹤領(lǐng)域被廣泛認可并應用的方法,主要通過(guò)攝像頭捕捉人眼特征,通過(guò)算法建立人眼二維或者三維注視點(diǎn)估計模型,通過(guò)算法判斷人眼動(dòng)作和注視點(diǎn)。
眼球的特殊構造會(huì )形成一到多個(gè)浦肯野像,基于這種方法的眼球追蹤一般定位第一浦肯野像,通過(guò)定標步驟,可以測量出在垂直平面現實(shí)定標點(diǎn)表面上人眼的注視點(diǎn)。
來(lái)張示意圖看看:
為了從頭部運動(dòng)中區分眼球動(dòng)作,需要眼球上的兩個(gè)參考點(diǎn)。這種瞳孔中心與角膜反射之間的位置差異之隨眼球轉動(dòng)而變化,同輕微的頭部運動(dòng)相對恒定,不管瞳孔在眼眶中如何轉動(dòng),浦肯野像同眼球相對固定。目前我在七鑫易維了解到的眼球追蹤算法,已經(jīng)做到了頭部的正常動(dòng)作不影響注視點(diǎn)的判斷,并且采用紅外弱光進(jìn)行彌補了亞洲人人眼特征不明顯的問(wèn)題,可以很精準地捕捉到人眼的注視點(diǎn)??梢哉f(shuō),這樣的技術(shù)已經(jīng)不是問(wèn)題。
根據大腦——眼睛一致性假設,人們所看的一般是其大腦中正在處理的內容,這是人類(lèi)視覺(jué)系統的工作方式?;谶@個(gè)假設,采用眼動(dòng)跟蹤技術(shù)來(lái)研究人類(lèi)心理已有近百年的歷史。在人機交互過(guò)程中,注視等同于注意力。
所以說(shuō)云視鏈的“讀眼神”完全可以實(shí)現,但是路徑要正確。
以“眼神推薦系統”為例。
首先,根據角膜反射技術(shù)及相關(guān)算法,完全可以捕獲到用戶(hù)的注視點(diǎn)。接下來(lái),可以對用戶(hù)的注視目標進(jìn)行模式識別(例如,識別出他注視的形狀是一個(gè)紅色的女士手提包)。進(jìn)而可以根據用戶(hù)的瀏覽記錄提取一些框架信息,比如,用戶(hù)看的都是紅色、細帶的手提包,并且注視點(diǎn)經(jīng)常停留在包的發(fā)行時(shí)間上,可以推斷這個(gè)用戶(hù)目前就是想買(mǎi)一個(gè)紅色的細帶手提包,而且很關(guān)注它是不是新上市的潮流產(chǎn)品;可以通過(guò)分析瞳孔直徑的變化,推斷用戶(hù)的情緒。
在以上三點(diǎn)的基礎上,完全可以給用戶(hù)實(shí)現精準推送,匹配某寶、某東的物品給用戶(hù)。這和很多購物網(wǎng)站上的“猜你喜歡”之類(lèi)的標簽某種意義上原理是一致的,不過(guò)過(guò)去只能通過(guò)分析用戶(hù)點(diǎn)擊、分析購物車(chē)等操作才能記錄喜好,現在只要一個(gè)眼神。從對用戶(hù)認知的把握與實(shí)現簡(jiǎn)易程度兩個(gè)層面來(lái)講,可以說(shuō),眼動(dòng)跟蹤技術(shù)產(chǎn)生的數據非常寶貴,且是其他輸入通道所無(wú)法替代的。
對于眼球追蹤技術(shù)方面產(chǎn)業(yè)鏈,國內目前有很多,而真正實(shí)現技術(shù)突破的并不多,這也導致國人對新技術(shù)狂歡。但是,反觀(guān)眼球追蹤方面的突破給特定人群帶來(lái)的希望也很勵志,比如“中國的霍金”王甲用眼睛寫(xiě)出了兩本書(shū),漸凍人“好想飛”也用眼睛打字開(kāi)起了網(wǎng)店。這些都是技術(shù)帶來(lái)的美好。
視覺(jué)在人類(lèi)獲取信息渠道所占比例超過(guò)80%,注視點(diǎn)信息就是視覺(jué)信息中最重要的,眼球追蹤技術(shù)會(huì )給很多行業(yè)帶來(lái)翻天覆地的變化,也會(huì )孕育出新的偉大公司,但絕不會(huì )是沒(méi)有核心技術(shù)的忽悠型公司。
(本文作者黃通兵,系七鑫易維CEO,眼控行業(yè)相關(guān)人士。本文僅代表作者個(gè)人觀(guān)點(diǎn))
評論comment