虛擬現實(shí)的關(guān)鍵技術(shù)及其作用
來(lái)源:中國數字音視網(wǎng) 編輯:數字音視工程 2009-08-03 00:00:00 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
虛擬現實(shí)是多種技術(shù)的綜合,包括實(shí)時(shí)三維計算機圖形技術(shù),廣角(寬視野)立體顯示技術(shù),對觀(guān)察者頭、眼和手的跟蹤技術(shù),以及觸覺(jué)/力覺(jué)反饋、立體聲、網(wǎng)絡(luò )傳輸、語(yǔ)音輸入輸出技術(shù)等。下面對這些技術(shù)分別加以說(shuō)明。
實(shí)時(shí)三維計算機圖形技術(shù)
相比較而言,利用計算機模型產(chǎn)生圖形圖像并不是太難的事情。如果有足夠準確的模型,又有足夠的時(shí)間,我們就可以生成不同光照條件下各種物體的精確圖像,但是這里的關(guān)鍵是實(shí)時(shí)。例如在飛行模擬系統中,圖像的刷新相當重要,同時(shí)對圖像質(zhì)量的要求也很高,再加上非常復雜的虛擬環(huán)境,問(wèn)題就變得相當困難。
廣角(寬視野)的立體顯示
人看周?chē)氖澜鐣r(shí),由于兩只眼睛的位置不同,得到的圖像略有不同,這些圖像在腦子里融合起來(lái),就形成了一個(gè)關(guān)于周?chē)澜绲恼w景象,這個(gè)景象中包括了距離遠近的信息。當然,距離信息也可以通過(guò)其他方法獲得,例如眼睛焦距的遠近、物體大小的比較等。
在VR系統中,雙目立體視覺(jué)起了很大作用。用戶(hù)的兩只眼睛看到的不同圖像是分別產(chǎn)生的,顯示在不同的顯示器上。有的系統采用單個(gè)顯示器,但用戶(hù)帶上特殊的眼鏡后,一只眼睛只能看到奇數幀圖像,另一只眼睛只能看到偶數幀圖像,奇、偶幀之間的不同也就是視差就產(chǎn)生了立體感。
用戶(hù)(頭、眼)的跟蹤:在人造環(huán)境中,每個(gè)物體相對于系統的坐標系都有一個(gè)位置與姿態(tài),而用戶(hù)也是如此。用戶(hù)看到的景象是由用戶(hù)的位置和頭(眼)的方向來(lái)確定的。
跟蹤頭部運動(dòng)的虛擬現實(shí)頭套:在傳統的計算機圖形技術(shù)中,視場(chǎng)的改變是通過(guò)鼠標或鍵盤(pán)來(lái)實(shí)現的,用戶(hù)的視覺(jué)系統和運動(dòng)感知系統是分離的,而利用頭部跟蹤來(lái)改變圖像的視角,用戶(hù)的視覺(jué)系統和運動(dòng)感知系統之間就可以聯(lián)系起來(lái),感覺(jué)更逼真。另一個(gè)優(yōu)點(diǎn)是,用戶(hù)不僅可以通過(guò)雙目立體視覺(jué)去認識環(huán)境,而且可以通過(guò)頭部的運動(dòng)去觀(guān)察環(huán)境。
在用戶(hù)與計算機的交互中,鍵盤(pán)和鼠標是目前最常用的工具,但對于三維空間來(lái)說(shuō),它們都不太適合。在三維空間中因為有六個(gè)自由度,我們很難找出比較直觀(guān)的辦法把鼠標的平面運動(dòng)映射成三維空間的任意運動(dòng)?,F在,已經(jīng)有一些設備可以提供六個(gè)自由度,如3Space數字化儀和 SpaceBall空間球等。另外一些性能比較優(yōu)異的設備是數據手套和數據衣。
立體聲
人能夠很好地判定聲源的方向。在水平方向上,我們靠聲音的相位差及強度的差別來(lái)確定聲音的方向,因為聲音到達兩只耳朵的時(shí)間或距離有所不同。常見(jiàn)的立體聲效果就是靠左右耳聽(tīng)到在不同位置錄制的不同聲音來(lái)實(shí)現的,所以會(huì )有一種方向感?,F實(shí)生活里,當頭部轉動(dòng)時(shí),聽(tīng)到的聲音的方向就會(huì )改變。但目前在VR系統中,聲音的方向與用戶(hù)頭部的運動(dòng)無(wú)關(guān)。
觸覺(jué)與力覺(jué)反饋
在一個(gè)VR系統中,用戶(hù)可以看到一個(gè)虛擬的杯子。你可以設法去抓住它,但是你的手沒(méi)有真正接觸杯子的感覺(jué),并有可能穿過(guò)虛擬杯子的“表面”,而這在現實(shí)生活中是不可能的。解決這一問(wèn)題的常用裝置是在手套內層安裝一些可以振動(dòng)的觸點(diǎn)來(lái)模擬觸覺(jué)。
語(yǔ)音輸入輸出
在VR系統中,語(yǔ)音的輸入輸出也很重要。這就要求虛擬環(huán)境能聽(tīng)懂人的語(yǔ)言,并能與人實(shí)時(shí)交互。而讓計算機識別人的語(yǔ)音是相當困難的,因為語(yǔ)音信號和自然語(yǔ)言信號有其“多邊性”和復雜性。例如,連續語(yǔ)音中詞與詞之間沒(méi)有明顯的停頓,同一詞、同一字的發(fā)音受前后詞、字的影響,不僅不同人說(shuō)同一詞會(huì )有所不同,就是同一人發(fā)音也會(huì )受到心理、生理和環(huán)境的影響而有所不同。
使用人的自然語(yǔ)言作為計算機輸入目前有兩個(gè)問(wèn)題,首先是效率問(wèn)題,為便于計算機理解,輸入的語(yǔ)音可能會(huì )相當羅嗦。其次是正確性問(wèn)題,計算機理解語(yǔ)音的方法是對比匹配,而沒(méi)有人的智能。
評論comment