5G對音頻的賦能到底是怎么發(fā)生的?
來(lái)源:億歐 編輯:QQ123 2021-06-08 09:39:56 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
如果拿這個(gè)問(wèn)題去詢(xún)問(wèn)大部分手機用戶(hù),相信收獲的答案會(huì )是高清直播、VR、云游戲等等。應該近乎沒(méi)人會(huì )說(shuō),“5G來(lái)了,會(huì )讓我聽(tīng)音樂(lè )更爽”。
確實(shí),5G提高帶寬降低時(shí)延,基本指向于網(wǎng)絡(luò )能夠支撐更好畫(huà)質(zhì),于是無(wú)論視頻、游戲還是AR、VR,都把5G牢牢和視覺(jué)困在了一起。
那么5G網(wǎng)絡(luò )的升級,真的就跟聽(tīng)覺(jué)一點(diǎn)關(guān)系都沒(méi)有嗎?換言之,今天智能手機以及個(gè)人硬件里,關(guān)于“聽(tīng)”的那一部分是不是已經(jīng)走到了盡頭?
其實(shí)未必,5G雖然與視覺(jué)緊密相關(guān),但它能給聲音帶來(lái)的東西也不算少數。今天我們從幾個(gè)方向展示一下,5G對音頻的賦能到底是怎么發(fā)生的。
高音質(zhì)與低時(shí)延:5G特性下的聲音
首先能夠給聲音帶來(lái)改變的,依舊是5G的基礎特性:大帶寬與低時(shí)延。
沿著(zhù)這兩條軌跡,我們會(huì )發(fā)現現有聲音傳輸還是有較大空間來(lái)進(jìn)行優(yōu)化。在4G網(wǎng)絡(luò )環(huán)境下,我們習慣了隨時(shí)在線(xiàn)收聽(tīng)音樂(lè )、音頻節目,甚至觀(guān)看直播,但其基本是建立在音質(zhì)經(jīng)過(guò)較大幅度壓縮基礎上的。而當網(wǎng)絡(luò )傳輸速率達到10Gbps左右的時(shí)候,高清音質(zhì)也可以通過(guò)網(wǎng)絡(luò )快速傳輸,保證實(shí)時(shí)化共享。另一方面,5G網(wǎng)絡(luò )的低時(shí)延特性也給聲音帶來(lái)了新的可能,比如多聲源同步問(wèn)題可以得到比較妥善的解決。
把這些5G特性落到應用場(chǎng)景里,我們可以比較簡(jiǎn)單地看到,三個(gè)方面的5G+聲音能力將被打開(kāi)。隨之而來(lái)是一些新玩法可能被挖掘。
一、高清、高品質(zhì)音樂(lè )的在線(xiàn)化。
我們知道,一些高質(zhì)量音樂(lè )在手機段很難復現,一方面是由于揚聲環(huán)境有限,另一方面也是因為網(wǎng)絡(luò )環(huán)境限制,導致質(zhì)量較大的音頻文件很難傳輸。5G直接帶來(lái)的改變,是高品質(zhì)音樂(lè )和音頻節目具有更高的實(shí)現性。這個(gè)特性可能打開(kāi)的應用,不僅于音樂(lè )一項。很多對于音質(zhì)細節具有高要求的音頻內容,比如環(huán)境音、催眠音效、白噪音等等也可以獲得更好的輸出效果。比如用聲音來(lái)觸發(fā)大腦舒適感的ASMR,一直以來(lái)其圈內都強調專(zhuān)用收音設備的等級。而高等級收音同時(shí)也需要大帶寬網(wǎng)絡(luò )的輔助,才能終讓用戶(hù)體驗到效果,5G到來(lái)或許是類(lèi)似領(lǐng)域的一個(gè)契機。
二、讓聲音在5G中互動(dòng)。
5G的另一個(gè)特性是低時(shí)延,這意味著(zhù)不同音源的聲音可以更好組成統一體。這一點(diǎn)應用在在線(xiàn)音頻中,可以很好解決幾個(gè)終端同步收音合奏的效果。今天的直播界,也經(jīng)常會(huì )搞一些對唱和聲之類(lèi)的玩法,但質(zhì)量很難跟現場(chǎng)音樂(lè )相提并論。尤其樂(lè )器合奏,近乎于是無(wú)法在4G網(wǎng)絡(luò )環(huán)境下達成很好效果的。
5G網(wǎng)絡(luò )的特性,可以讓異地音樂(lè )排練變?yōu)榭赡?。而對商業(yè)形態(tài)的直接影響在于,5G網(wǎng)絡(luò )或許可以讓不同地域的歌手樂(lè )手完成高品質(zhì)的合奏玩法,換言之就是網(wǎng)上音樂(lè )會(huì )成為可能。在今天直播與音頻節目盛行的環(huán)境下,類(lèi)似玩法應該會(huì )有比較好的表現。
三、更好的聲畫(huà)同步效果。
音頻當然不止于自身,更多情況下它需要與視頻合作。5G網(wǎng)絡(luò )的低時(shí)延特性,一個(gè)可能性在于能夠升級VR、游戲等環(huán)境下的聲畫(huà)同步體驗,讓聲音更好與視覺(jué)配合。這個(gè)體驗直接的商業(yè)想象力在于互動(dòng)視頻,更復雜可交互的音效,是互動(dòng)視頻體驗升級的核心路徑之一。
聲音漂移:IoT環(huán)境下無(wú)處不在的聲音
更多時(shí)候,5G不能被看作一個(gè)單獨的技術(shù)路徑,而是必須與更多技術(shù)突破相結合,提供網(wǎng)絡(luò )方面的助力。對于聲音來(lái)說(shuō),這樣的“5G+”賦能也同樣存在。
比如我們知道,大量生活場(chǎng)景里的IoT設備,都趨向于取消按鍵和觸屏,而是用智能語(yǔ)音交互作為主要控制入口。
這也意味著(zhù),大量家庭生活與車(chē)載場(chǎng)景里的IoT設備,都將攜帶發(fā)聲設備。那么在5G環(huán)境下,這些設備將獲得更好的聯(lián)接效果與硬件虛擬化能力。聲音也就可以在這些設備之間更好傳輸。
或許不久的未來(lái),我們可以期待這樣的場(chǎng)景:客廳中用電視追劇的你,要起身去運動(dòng),然后去廚房搞點(diǎn)吃的。在執行這個(gè)非常符合減肥需求的行動(dòng)同時(shí),你并不想停止追劇,至少也要聽(tīng)個(gè)聲音。那么你可以把電視的聲音扔到運動(dòng)耳機上,運動(dòng)之后再把耳機的聲音扔到廚房的音箱,或者干脆扔到冰箱、燃氣灶上……
IoT體系下的聲音無(wú)縫體驗,并不僅僅意味著(zhù)用戶(hù)可以指揮聲音到處游走,同時(shí)也意味著(zhù)設備對用戶(hù)聲音的識別、理解與交互能力。每個(gè)設備和用戶(hù)說(shuō)過(guò)什么話(huà),學(xué)習到了什么東西,都需要體系化共享與再學(xué)習,這都需要建立在強大網(wǎng)絡(luò )環(huán)境上。5G和wifi6,目前看來(lái)是這一能力的網(wǎng)絡(luò )基礎基石。
IoT必須擁有更多能力,而聲音正是其中之一。
算法即聲音:AI+5G賦能音頻
或許關(guān)注AI領(lǐng)域的朋友有這樣一個(gè)感覺(jué),新聞里的AI語(yǔ)音能力越來(lái)越神奇,什么聲音克隆、情緒識別、機器對話(huà),都非常強力。但落到自己的手機和音箱上,總感覺(jué)有點(diǎn)傻傻的?
這里面有一個(gè)核心問(wèn)題,就是算力和網(wǎng)絡(luò )環(huán)境不達標,龐大的深度學(xué)習模型沒(méi)法在現有條件下跑在終端設備上。雖然類(lèi)似問(wèn)題出現在機器視覺(jué)領(lǐng)域更多,但隨著(zhù)這兩年語(yǔ)音模型飛速發(fā)展,算力和網(wǎng)絡(luò )能力不足,優(yōu)秀算法不能落到用戶(hù)終端的問(wèn)題,也開(kāi)始出現在了語(yǔ)音領(lǐng)域。
所以5G給音頻的賦能,另一個(gè)想象力在于跟AI結合。
未來(lái),我們聽(tīng)見(jiàn)的機器聲音和其他人傳遞過(guò)來(lái)的音頻,很有可能已經(jīng)經(jīng)過(guò)了大量算法“美化”。聲音界更具欺詐性的“喬碧蘿殿下”可謂指日可待。
相對需要5G網(wǎng)絡(luò )加持的語(yǔ)音算法應用,包括機器音的實(shí)時(shí)美化和情緒修飾、聲音克隆、多模態(tài)語(yǔ)義理解等等。另一方面,在5G網(wǎng)絡(luò )下,AI也將有條件更好理解用戶(hù)的聲音,并從中產(chǎn)生更多玩法和商業(yè)化價(jià)值。
5G即將到來(lái),升級網(wǎng)絡(luò )環(huán)境和眾多新網(wǎng)絡(luò )特性,對于各產(chǎn)業(yè)都將帶來(lái)不同的升級效果。對于內容創(chuàng )作者來(lái)說(shuō),5G是新的畫(huà)板。無(wú)論你的創(chuàng )作載體是聲音、視頻、游戲,或者想象中的其他形式,5G都是一個(gè)新的機遇。
評論comment