科學(xué)家開(kāi)發(fā)用于智能手機的“蝙蝠感知”技術(shù) 可利用聲音生成圖像
來(lái)源:cnBeta 編輯:QQ123 2021-05-20 08:58:51 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
值得注意的是,這項技術(shù)的核心是一種復雜的機器學(xué)習算法,它利用反射回聲來(lái)生成圖像,類(lèi)似于蝙蝠使用回聲定位進(jìn)行導航和狩獵的方式。
該算法測量揚聲器發(fā)出的聲音片段或小天線(xiàn)發(fā)出的無(wú)線(xiàn)電波脈沖在室內空間內發(fā)射并返回到傳感器所需的時(shí)間。通過(guò)巧妙地分析結果,該算法可以推斷出一個(gè)房間的形狀、大小和布局,以及挑選出存在的物體或人。結果以視頻形式顯示,將回聲數據轉化為三維視覺(jué)。
該團隊的成就與蝙蝠的回聲定位之間的一個(gè)關(guān)鍵區別是,蝙蝠有兩只耳朵來(lái)幫助它們導航,而該算法被調整為與從單點(diǎn)收集的數據一起工作,如麥克風(fēng)或無(wú)線(xiàn)電天線(xiàn)。研究人員說(shuō),該技術(shù)可用于通過(guò)潛在的任何配備有麥克風(fēng)和揚聲器或無(wú)線(xiàn)電天線(xiàn)的設備來(lái)生成圖像。
格拉斯哥大學(xué)的計算機科學(xué)家和物理學(xué)家周日在《物理評論快報》雜志上發(fā)表的一篇論文中概述了這項研究,它可以應用于安全和醫療保健領(lǐng)域。格拉斯哥大學(xué)計算科學(xué)學(xué)院和物理與天文學(xué)學(xué)院的Alex Turpin博士和Valentin Kapitany博士是該論文的主要作者。
Turpin博士說(shuō):“動(dòng)物的回聲定位是一種了不起的能力,科學(xué)已經(jīng)成功地以多種不同的方式重新創(chuàng )造了從反射回聲中生成三維圖像的能力,如RADAR和LiDAR。”
“這項研究與其他系統的不同之處在于,首先,它只需要來(lái)自單一輸入的數據--麥克風(fēng)或天線(xiàn)--就能創(chuàng )建三維圖像。其次,我們相信,我們開(kāi)發(fā)的算法可以將任何具有這兩件裝備中的任何一件的設備變成回聲定位設備。”
“這意味著(zhù)這種三維成像的成本可以大大降低,開(kāi)辟許多新的應用。例如,通過(guò)接收入侵者反射的信號,可以在沒(méi)有傳統攝像機的情況下保證建筑物的安全。同樣的方法也可以用來(lái)追蹤養老院中虛弱病人的行動(dòng)。我們甚至可以看到該系統被用于跟蹤醫療機構中病人胸部的起伏,提醒工作人員注意他們的呼吸變化。”
該論文概述了研究人員如何使用筆記本電腦的揚聲器和麥克風(fēng)來(lái)產(chǎn)生和接收千赫茲范圍內的聲波。他們還使用天線(xiàn)對千兆赫茲范圍內的無(wú)線(xiàn)電頻率聲音進(jìn)行了同樣的處理。
在每一種情況下,他們都收集了一個(gè)人在房間里走動(dòng)時(shí)對聲波的反射的數據。同時(shí),他們還使用一個(gè)特殊的相機記錄了房間的數據,該相機使用一個(gè)被稱(chēng)為飛行時(shí)間的過(guò)程來(lái)測量房間的尺寸并提供一個(gè)低分辨率的圖像。
通過(guò)結合來(lái)自麥克風(fēng)的回聲數據和來(lái)自飛行時(shí)間相機的圖像數據,研究小組在數百次的重復中“訓練”了他們的機器學(xué)習算法,將回聲中的特定延遲與圖像聯(lián)系起來(lái)。最終,該算法已經(jīng)學(xué)會(huì )了僅從回聲數據中生成它自己的高度準確的房間及其內容的圖像,使它具有感知周?chē)h(huán)境的“蝙蝠式”能力。
這項研究建立在該團隊以前的工作基礎上,該團隊訓練了一種神經(jīng)網(wǎng)絡(luò )算法,通過(guò)使用單像素檢測器測量閃光的反射來(lái)建立三維圖像。
Turpin博士補充說(shuō):“我們現在已經(jīng)能夠利用光和聲音證明這種算法機器學(xué)習技術(shù)的有效性,這非常令人激動(dòng)。很明顯,這里有很多以新方式感知世界的潛力,我們渴望繼續探索未來(lái)生成更多高分辨率圖像的可能性。”
評論comment