DAV首頁(yè)

數字音視工程網(wǎng)

微信公眾號

手機DAV

熱門(mén)搜索：

技術(shù)風(fēng)向標

我的位置：

IPTV編解碼標準綜述

來(lái)源：中廣互聯(lián) 編輯：ann 2012-10-25 11:52:44 加入收藏咨詢(xún)

咨詢(xún)

所在單位:	*
姓名:	*
手機:	*
職位:
郵箱:	*
其他聯(lián)系方式:
咨詢(xún)內容:
驗證碼:	不能為空驗證碼錯誤

確定

　　IPTV是一種利用寬帶網(wǎng)，集互聯(lián)網(wǎng)、多媒體、通訊等多種技術(shù)于一體，向家庭用戶(hù)提供包括數字電視在內的多種交互式服務(wù)的嶄新技術(shù)。由于國際上固話(huà)運營(yíng)商都是從最近兩年才興起IPTV熱，所以至今也沒(méi)有一個(gè)國家在IPTV業(yè)務(wù)方面形成成熟標準，國內IPTV業(yè)務(wù)也同樣無(wú)標準可循。中國通信標準化協(xié)會(huì )(CCSA)IP與多媒體工作委員會(huì )IPTV特別工作組于2005年下半年成立，并啟動(dòng)了對IPTV標準的研究和制訂工作。參加IPTV特別工作組的單位幾乎包含了目前從事IPTV業(yè)務(wù)運營(yíng)、開(kāi)發(fā)和研究的國內外所有企業(yè)。

　　IPTV最重要的標準就是編解碼標準，編碼直接關(guān)系到解碼，解碼又會(huì )影響到機頂盒。標準化是產(chǎn)業(yè)化成功的前提，之所以目前尚沒(méi)有廠(chǎng)家大規模生產(chǎn)網(wǎng)絡(luò )機頂盒，一個(gè)重要原因就是沒(méi)有確定的標準支持。盡管IPTV編解碼標準有很多種，但在中國主要是采用MPEG-4、H.264技術(shù)以及中國提出的具有自主知識產(chǎn)權的標準AVS，國內企業(yè)面臨一場(chǎng)抉擇。

　　1 MPEG-4標準簡(jiǎn)介

　　運動(dòng)圖像專(zhuān)家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標準第一版本。同年年底MPEG-4第二版亦告底定，且于2000年年初正式成為國際標準。MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法，它是針對數字電視、交互式繪圖應用、交互式多媒體等整合及壓縮技術(shù)的需求而制定的國際標準。MPEG-4標準將眾多的多媒體應用集成于一個(gè)完整的框架內，旨在為多媒體通信及應用環(huán)境提供標準的算法及工具，從而建立起一種能被多媒體傳輸、存儲、檢索等應用領(lǐng)域普遍采用的統一數據格式。

　　MPEG-4的編碼理念是：MPEG-4標準同以前標準的最顯著(zhù)的差別在于它是采用基于對象的編碼理念，即在編碼時(shí)將一幅景物分成若干在時(shí)間和空間上相互聯(lián)系的視頻音頻對象，分別編碼后，再經(jīng)過(guò)復用傳輸到接收端，然后再對不同的對象分別解碼，從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象采用不同的編碼方法和表示方法，又有利于不同數據類(lèi)型間的融合，并且這樣也可以方便的實(shí)現對于各種對象的操作及編輯。

　　MPEG-4除采用第一代視頻編碼的核心技術(shù)，如變換編碼、運動(dòng)估計與運動(dòng)補償、量化、熵編碼外，還提出了一些新的有創(chuàng )見(jiàn)性的關(guān)鍵技術(shù)，并在第一代視頻編碼技術(shù)基礎上進(jìn)行了卓有成效的完善和改進(jìn)。下面重點(diǎn)介紹其中的一些關(guān)鍵技術(shù)。

　　(1)視頻對象提取技術(shù)

　　MPEG-4實(shí)現基于內容交互的首要任務(wù)就是把視頻/圖像分割成不同對象或者把運動(dòng)對象從背景中分離出來(lái)，然后針對不同對象采用相應編碼方法，以實(shí)現高效壓縮。因此視頻對象提取即視頻對象分割，是MPEG-4視頻編碼的關(guān)鍵技術(shù)，也是新一代視頻編碼的研究熱點(diǎn)和難點(diǎn)。

　　盡管MPEG-4 框架已經(jīng)制定，但至今仍沒(méi)有通用的有效方法去根本解決視頻對象分割問(wèn)題，視頻對象分割被認為是一個(gè)具有挑戰性的難題，基于語(yǔ)義的分割則更加困難。目前進(jìn)行視頻對象分割的一般步驟是：先對原始視頻/圖像數據進(jìn)行簡(jiǎn)化以利于分割，這可通過(guò)低通濾波、中值濾波、形態(tài)濾波來(lái)完成;然后對視頻/圖像數據進(jìn)行特征提取，可以是顏色、紋理、運動(dòng)、幀差、位移幀差乃至語(yǔ)義等特征;再基于某種均勻性標準來(lái)確定分割決策，根據所提取特征將視頻數據歸類(lèi);最后是進(jìn)行相關(guān)后處理，以實(shí)現濾除噪聲及準確提取邊界。

　　(2)VOP視頻編碼技術(shù)

　　視頻對象平面(VOP，Video Object Plane)是視頻對象(VO)在某一時(shí)刻的采樣，VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過(guò)程中針對不同VO采用不同的編碼策略，即對前景VO的壓縮編碼盡可能保留細節和平滑;對背景VO則采用高壓縮率的編碼策略，甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產(chǎn)生的方塊效應，而且使用戶(hù)可與場(chǎng)景交互，從而既提高了壓縮比，又實(shí)現了基于內容的交互，為視頻編碼提供了廣闊的發(fā)展空間。MPEG-4支持任意形狀圖像與視頻的編解碼。

　　(3)視頻編碼可分級性技術(shù)

　　隨著(zhù)因特網(wǎng)業(yè)務(wù)的巨大增長(cháng)，在速率起伏很大的IP(Internet Protocol)網(wǎng)絡(luò )及具有不同傳輸特性的異構網(wǎng)絡(luò )上進(jìn)行視頻傳輸的要求和應用越來(lái)越多。在這種背景下，視頻分級編碼的重要性日益突出，其應用非常廣泛，且具有很高的理論研究及實(shí)際應用價(jià)值，因此受到人們的極大關(guān)注。

　　MPEG-4通過(guò)視頻對象層(VOL，Video Object Layer)數據結構來(lái)實(shí)現分級編碼。MPEG-4提供了兩種基本分級工具，即時(shí)域分級(Temporal Scalability)和空域分級(SpatialScalability)，此外還支持時(shí)域和空域的混合分級。每一種分級編碼都至少有兩層VOL，低層稱(chēng)為基本層，高層稱(chēng)為增強層?；緦犹峁┝艘曨l序列的基本信息，增強層提供了視頻序列更高的分辨率和細節。

　　在隨后增補的視頻流應用框架中，MPEG-4提出了FGS(Fine Granularity Scalable，精細可伸縮性)視頻編碼算法以及PFGS(Progressive Fine Granularity Scalable，漸進(jìn)精細可伸縮性)視頻編碼算法。

　　FGS編碼實(shí)現簡(jiǎn)單，可在編碼速率、顯示分辨率、內容、解碼復雜度等方面提供靈活的自適應和可擴展性，且具有很強的帶寬自適應能力和抗誤碼性能。但還存在編碼效率低于非可擴展編碼及接收端視頻質(zhì)量非最優(yōu)兩個(gè)不足。 PFGS則是為改善FGS編碼效率而提出的視頻編碼算法，其基本思想是在增強層圖像編碼時(shí)使用前一幀重建的某個(gè)增強層圖像為參考進(jìn)行運動(dòng)補償，以使運動(dòng)補償更加有效，從而提高編碼效率。

　　(4)運動(dòng)估計與運動(dòng)補償技術(shù)

　　MPEG-4采用I-VOP、P-VOP、B-VOP三種幀格式來(lái)表征不同的運動(dòng)補償類(lèi)型。它采用了H.263中的半像素搜索(half pixel searching)技術(shù)和重疊運動(dòng)補償(overlapped motioncompensation)技術(shù)，同時(shí)又引入重復填充(repetitive padding)技術(shù)和修改的塊(多邊形)匹配(modified block (polygon)matching)技術(shù)以支持任意形狀的VOP區域。

　　此外，為提高運動(dòng)估計算法精度，MPEG-4采用了MVFAST(Motion Vector Field Adaptive Search Technique)和改進(jìn)的PMVFAST(Predictive MVFAST)方法用于運動(dòng)估計。對于全局運動(dòng)估計，則采用了基于特征的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。

　　在MPEG-4視頻編碼中，運動(dòng)估計相當耗時(shí)，對編碼的實(shí)時(shí)性影響很大。因此這里特別強調快速算法。運動(dòng)估計方法主要有像素遞歸法和塊匹配法兩大類(lèi)，前者復雜度很高，實(shí)際中應用較少，后者則在H.263和MPEG中廣泛采用。目前有三種常用的匹配準則：(1)絕對誤差和(SAD, Sum of Absolute Difference)準則：(2)均方誤差(MSE, Mean Square Error)準則;(3)歸一化互相關(guān)函數(NCCF, Normalized Cross Correlation Function)準則。在上述三種準則中，SAD準則具有不需乘法運算、實(shí)現簡(jiǎn)單方便的優(yōu)點(diǎn)而使用最多，但應清楚匹配準則的選用對匹配結果影響不大。

　　在選取匹配準則后就應進(jìn)行尋找最優(yōu)匹配點(diǎn)的搜索工作。最簡(jiǎn)單、最可靠的方法是全搜索法(FS, Full Search)，但計算量太大，不便于實(shí)時(shí)實(shí)現。因此快速搜索法應運而生，主要有交叉搜索法、二維對數法和鉆石搜索法，其中鉆石搜索法被MPEG-4校驗模型(VM, Verification Model)所采納。

　　2 H.264標準簡(jiǎn)介

　　2003年，ITU-T通過(guò)了一個(gè)新的數字視頻編解碼標準，即H.264標準，H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編解碼標準。國際電信聯(lián)盟將該系統命名為H.264/AVC，國際標準化組織和國際電工委員會(huì )將其稱(chēng)為14496-10/MPEG-4 AVC。

　　H.264標準只有三個(gè)子集：基本子集、主體子集和擴展子集?；咀蛹菍?zhuān)為視頻會(huì )議應用設計的，這套標準幾近完美，能夠提供強大的差錯隱消技術(shù)(應用該技術(shù)，即使在Internet這樣的易錯網(wǎng)絡(luò )上也可以得到較好的視頻效果)，并且支持低延時(shí)編/解碼技術(shù)，使視頻會(huì )議顯得更自然。主體子集和擴展子集更適合于電視應用(數字廣播、DVD)和延時(shí)顯得并不很重要的視頻流應用。

　　H.264標準的關(guān)鍵技術(shù)如下：

　　(1)幀內預測編碼

　　幀內編碼用來(lái)縮減圖像的空間冗余。為了提高H.264幀內編碼的效率，在給定幀中充分利用相鄰宏塊的空間相關(guān)性，相鄰的宏塊通常含有相似的屬性。因此，在對一給定宏塊編碼時(shí)，首先可以根據周?chē)暮陦K預測，然后對預測值與實(shí)際值的差值進(jìn)行編碼，這樣，相對于直接對該幀編碼而言，可以大大減小碼率。H.264提供6種模式進(jìn)行4×4像素宏塊預測，包括1種直流預測和5種方向預測，H.264也支持16×16的幀內編碼。

　　(2)幀間預測編碼

　　幀間預測編碼利用連續幀中的時(shí)間冗余來(lái)進(jìn)行運動(dòng)估計和補償。H.264的運動(dòng)補償支持以往的視頻編碼標準中的大部分關(guān)鍵特性，而且靈活地添加了更多的功能，除了支持P幀、B幀外，H.264還支持一種新的流間傳送幀——SP幀，碼流中包含SP幀后，能在有類(lèi)似內容但有不同碼率的碼流之間快速切換，同時(shí)支持隨機接入和快速回放模式。

　　(3) 整數變換

　　在變換方面，H.264使用了基于4×4像素塊的類(lèi)似于DCT的變換，但使用的是以整數為基礎的空間變換，不存在反變換。與浮點(diǎn)運算相比，整數DCT變換會(huì )引起一些額外的誤差，但因為DCT變換后的量化也存在量化誤差，與之相比，整數DCT變換引起的量化誤差影響并不大。此外，整數DCT變換還具有減少運算量和復雜度，有利于向定點(diǎn)DSP移植的優(yōu)點(diǎn)。

　　(4)量化

　　H.264中可選32種不同的量化步長(cháng)，這與H.263中有31個(gè)量化步長(cháng)很相似，但是在H.264中，步長(cháng)是以12.5%的復合率遞進(jìn)的，而不是一個(gè)固定常數。在H.264中，變換系數的讀出方式也有兩種：之字形(Zigzag)掃描和雙掃描，大多數情況下使用簡(jiǎn)單的之字形掃描;雙掃描僅用于使用較小量化級的塊內，有助于提高編碼效率。

　　(5)熵編碼

　　視頻編碼處理的最后一步就是熵編碼，H.264標準采用的熵編碼有兩種：一種是基于內容的自適應變長(cháng)編碼(CAVLC)與統一的變長(cháng)編碼(UVLC)結合;另一種是基于內容的自適應二進(jìn)制算術(shù)編碼(CABAC)。CAVLC與CABAC根據相臨塊的情況進(jìn)行當前塊的編碼，以達到更好的編碼效率。CABAC比CAVLC壓縮效率高，但要復雜一些。

　　3 AVS標準簡(jiǎn)介

　　AVS是基于我國創(chuàng )新技術(shù)和部分公開(kāi)技術(shù)的自主標準，AVS標準包括系統、視頻、音頻、數字版權管理等四個(gè)主要技術(shù)標準和一致性測試等支撐標準。2002年，在信息產(chǎn)業(yè)部支持下，成立了“數字音視頻編解碼技術(shù)標準”工作組(簡(jiǎn)稱(chēng)AVS工作組)，2003年，國家發(fā)展和改革委員會(huì )批準了《數字音視頻編解碼技術(shù)標準AVS研究開(kāi)發(fā)與測試驗證重大專(zhuān)項》。在國內外上百家企業(yè)和科研單位共同參與下，AVS標準制定工作進(jìn)展順利，其中最重要的視頻編碼標準于2005年通過(guò)國家廣電總局測試，2006年1月得到信息產(chǎn)業(yè)部批準，2月國家標準化管理委員會(huì )正式頒布，3月1日起實(shí)施。

　　AVS視頻編解碼的核心技術(shù)包括：8x8整數變換、量化、幀內預測、1/4精度像素插值、特殊的幀間預測運動(dòng)補償、二維熵編碼等。

　　(1)變換量化

　　AVS的8x8變換與量化可以在16位處理器上無(wú)失配地實(shí)現，從而克服了H.264之前所有視頻壓縮編碼國際標準中采用的8x8 DCT變換存在失配的固有問(wèn)題。而H.264所采用的4x4整數變換在高分辨率的視頻圖像上的去相關(guān)性能不及8x8的變換有效。AVS采用了64級量化，可以完全適應不同的應用和業(yè)務(wù)對碼率和質(zhì)量的要求。

　　(2)幀內預測

　　AVS的幀內預測技術(shù)沿襲了H.264幀內預測的思路，用相鄰塊的像素預測當前塊，采用代表空間域紋理方向的多種預測模式。但AVS亮度和色度幀內預測都是以8x8塊為單位的。亮度塊采用5種預測模式，色度塊采用4種預測模式，而這4種模式中又有3種和亮度塊的預測模式相同。在編碼質(zhì)量相當的前提下，AVS采用較少的預測模式，使方案更加簡(jiǎn)潔、實(shí)現的復雜度大為降低。

　　(3)幀間預測

　　幀間運動(dòng)補償編碼是混合編碼技術(shù)框架中最重要的部分之一。AVS標準采用了16×16，16×8，8×16和8×8的塊模式進(jìn)行運動(dòng)補償，而去除了H.264標準中的8×4，4×8，4×4的塊模式，目的是能更好地刻畫(huà)物體運動(dòng)，提高運動(dòng)搜索的準確性。實(shí)驗表明，對于高分辨率視頻，AVS選用的塊模式已經(jīng)能足夠精細地表達物體的運動(dòng)。較少的塊模式，能降低運動(dòng)矢量和塊模式傳輸的開(kāi)銷(xiāo)，從而提高壓縮效率、降低編解碼實(shí)現的復雜度。

　　AVS和H.264都采用了1/4像素精度的運動(dòng)補償技術(shù)。H.264采用6抽頭濾波器進(jìn)行半像素插值并采用雙線(xiàn)性濾波器進(jìn)行1/4像素插值。而AVS采用了不同的4抽頭濾波器進(jìn)行半像素插值和1/4像素插值，在不降低性能的情況下減少插值所需要的參考像素點(diǎn)，減小了數據存取帶寬需求。

　　在傳統的視頻編碼標準中，雙向預測幀B幀都只有一個(gè)前向參考幀與一個(gè)后向參考幀，而前向預測幀P 幀則只有一個(gè)前向參考幀。AVS中P幀可以利用至多2幀的前向參考幀，而B(niǎo)幀采用前后各一個(gè)參考幀，P幀與B幀(包括后向參考幀)的參考幀數相同，其參考幀存儲空間與數據存取的開(kāi)銷(xiāo)并不比傳統視頻編碼的標準大，而恰恰是充分利用了必須預留的資源。AVS的B幀的雙向預測使用了直接模式(direct mode)、對稱(chēng)模式(symmetric mode)和跳過(guò)模式(skip mode)。使用對稱(chēng)模式時(shí)，碼流只需要傳送前向運動(dòng)矢量，后向運動(dòng)矢量可由前向運動(dòng)矢量導出，從而節省后向運動(dòng)矢量的編碼開(kāi)銷(xiāo)。對于直接模式，當前塊的前、后向運動(dòng)矢量都是由后向參考圖像相應位置塊的運動(dòng)矢量導出，無(wú)需傳輸運動(dòng)矢量，因此也可以節省運動(dòng)矢量的編碼開(kāi)銷(xiāo)。跳過(guò)模式的運動(dòng)矢量的導出方法和直接模式的相同，跳過(guò)模式編碼的塊運動(dòng)補償的殘差為零，即該模式下宏塊只需要傳輸模式信號，而不需要傳輸運動(dòng)矢量、補償殘差等附加信息。

　　(4)熵編碼

　　AVS熵編碼采用自適應變長(cháng)編碼技術(shù)，在A(yíng)VS熵編碼過(guò)程中，所有的語(yǔ)法元素和殘差數據都是以指數哥倫布碼的形式映射成二進(jìn)制比特流。采用指數哥倫布碼的優(yōu)勢在于：一方面，它的硬件復雜度比較低，可以根據閉合公式解析碼字，無(wú)需查表;另一方面，它可以根據編碼元素的概率分布靈活地確定以k階指數哥倫布碼編碼，如果k選得恰當，則編碼效率可以逼近信息熵。對預測殘差的塊變換系數，經(jīng)掃描形成(level、run)對串，level、run不是獨立事件，而存在著(zhù)很強的相關(guān)性，在A(yíng)VS中level、run采用二維聯(lián)合編碼，并根據當前l(fā)evel、run的不同概率分布趨勢，自適應改變指數哥倫布碼的階數。

免責聲明：本文來(lái)源于中廣互聯(lián)，本文僅代表作者個(gè)人觀(guān)點(diǎn)，本站不作任何保證和承諾，若有任何疑問(wèn)，請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。(原創(chuàng )稿件未經(jīng)許可,不可轉載,轉載請注明來(lái)源)

掃一掃關(guān)注數字音視工程網(wǎng)公眾號

評論comment

推薦閱讀recommend

重磅！建碁AOPEN攜ChromeOS OPS電腦BP5130亮相2025年臺北國際電腦展！
查看詳情
光影與文化的交響：奧圖碼投影科技重塑夜游文旅新體驗
查看詳情
建碁 AOPEN 邀請函 | 2025年臺北國際電腦展COMPUTEX 2025！
查看詳情
【Infocomm 2025】DAV專(zhuān)訪(fǎng)?？低曇詧?chǎng)景化創(chuàng )新引領(lǐng)音視頻新時(shí)代
查看詳情

国产av福利久久精品can动漫|2021精品国产自在现线|亚洲无线观看国产高清|欧洲人妻丰满av无码久久不卡|欧美情侣性视频