實現視訊通訊 解說3GPP行動視訊標準規格

2005-08-25
視訊通訊(Video Communication)的實現在有線及行動寬頻網路的普及與未來性的發展下,已成為市場推動力的主要應用,可望以多媒體通訊服務取代只有聲音的傳統通訊模式...
視訊通訊(Video Communication)的實現在有線及行動寬頻網路的普及與未來性的發展下,已成為市場推動力的主要應用,可望以多媒體通訊服務取代只有聲音的傳統通訊模式。其中,在行動視訊的多媒體通訊應用中,就以多媒體訊息及視訊電話與會議系統(Video Phone and Conferencing)為主。3GPP也針對此行動視訊應用有相關的技術文件。本文將介紹行動視訊在3GPP上的技術發展、視訊編解碼器的演進及目前業界的主要動態。  

 

行動通訊網路從類比通訊架構,逐漸有2G、2.5G、2.75G、3G,甚至在目前3G的佈置尚未全面化的情況下,已有多個地區開始實驗3G以後的行動通訊網路(圖1)。通訊系統的演進腳步逐漸加快,近幾年來,行動通訊業務的高度成長的確是當紅的高科技產業。但手機銷售與用戶的成長及營運業者對每個用戶的營業額,都已趨近緩和。上、中、下游的行動通訊業者都寄望3G系統所能帶來的多媒體應用,能為其開拓美好的遠景(圖2、3)。3GPP(3rd Generation Partnership Project)的技術規格與報告為以UMTS為主的第三代行動通訊標準,訂定一系列的實現準則。其中,有關行動視訊部分,本文將針對MMS及Video Phone做一個整理。我們會先針對視訊編解碼器的標準與技術發展,做一個完整的回顧;接著會整理3GPP中有關行動視訊的技術規格;最後可藉由業界的例子,讓大家了解行動視訊的必然性。  

視訊編解碼器的標準與技術發展  

我們都知道,視訊編解碼技術為以多媒體為主軸應用的消費性電子、資訊、網路通訊等ICT產業技術中,不可或缺的關鍵性技術。從視訊編解碼技術的國際標準來看,以ITU-T視訊編碼規範,例如H.261、H.262、H.263和H.264,以及ISO/IEC採用之視訊編碼標準,例如MPEG-1、MPEG-2、MPEG-4和MPEG-21為主(圖4)。其適用的各種應用包括視訊會議和影像電話、視訊儲存(VCD/DVD/HD-DVD)、個人隨身播放(Portable Media Player)、家庭影音中心(Home Media Center)、廣播視訊(有線電視、地面廣播、衛星電視和DSL)、視訊監控以及視訊串流等。  

H.261視訊編解碼技術標準的訂定,是以ISDN(如H.320)視訊電話為主要應用平台,為配合ISDN的B Channel特性,所以,64Kbps就成為其主要基本單位。H.263的標準一開始以PSTN(如H.324)視訊電話為主要應用平台,後來隨著IP網路的興起,也成為IP Video Phone(如H.323、SIP等)中Video Coding Standard的首選。為因應封包交換網路的不定特性,H.263也以增加Tool的方式,有了第二及第三版的問世。後來的MPEG-4及H.264/AVC,也是從H.263演進而來,並有相關的Profiles來支援行動視訊的應用。至於MPEG-1與MPEG-2的視訊編解碼技術標準,其應用並不屬於本文探索的範圍,先予以略過。  

H.261、H.263及MPEG-4等視訊編解碼技術標準,都被3GPP指定為相關行動視訊的視訊編解碼器,過去幾年也多有文章討論及詳述,在此就不贅述。目前國際上最著名的視訊編解碼技術,就屬由兩大國際標準組織ITU-T和ISO/IEC,於2003年5月所共同製訂完成的H.264/AVC視訊編碼標準。大約在2001年底,ISO/IEC MPEG工作小組有鑑於H.264的效能已超過MPEG-4標準,因此決定與ITU-T VCEG合作,組成聯合視訊小組(Joint Video Team,JVT),共同發展由ITU-T首先提出的H.264(前身為H.26L)標準(圖5)。所以,H.264又稱為MPEG-4 Part 10(14496-10)、MPEG-4 AVC或JVT。  

H.264/AVC有多項獨特優點,使它遠超過其他現有標準的效能(圖6):  

‧高壓縮率:相較於之前的視訊編解碼標準MPEG-2、H.263+/++或MPEG-4,在相同視訊品質與編碼器最佳化的條件下,最多達2~3倍的壓縮率。  

‧高品質視訊:在不同的位元速率下,H.264較能提供穩定且良好的視訊品質。  

‧抗錯性(Error Resilience):H.264包括多種必要工具,不但有偵測網路封包遺失,且有錯誤更正的功能。  

‧網路傳輸功能的加強:利用網路適應層(Network Adaptation Layer,NAL),H.264的壓縮位元流能在不同的底層網路傳輸。  

‧H.264/AVC標準已製訂出三個Profiles:Baseline Profile、Main Profile及 Extended Profile(圖7),分別適用於視訊電話/會議/行動應用、廣播視訊應用以及視訊串流/行動視訊應用。  

與MPEG-4 Part-2做個簡單的比較說明(表1),MPEG-4 Part-2較舊有標準廣泛適用的位元率範圍、支援物件型態編碼(Object-Based Coding)、合成影像(Synthetic Video)、容錯性編碼技術(Error-Resilient)及細微式可調適性編碼技術(Fine Granularity Scalability,FGS)等功能,造就出MPEG-4 Part-2的19個Profiles。一時之間,各式各樣的應用如寬頻/行動網路應用、多媒體儲存系統、互動電視、電影製作等,都非MPEG-4 Part-2莫屬。但MPEG-4 Part-2的多樣化功能中,目前如何為市場所接受的最根本問題還是在編碼技術,「如何在一定的品質下,達到最好的壓縮率」,市場的接受度還是以壓縮率與高品質為首要需求。H.264/AVC不同於MPEG-4 Part-2的多目的功能,它的主要目的著重於壓縮率與高品質的同時呈現,幾個重要的Tools大大提升了編碼效果。雖然付出了運算能力與複雜度的代價,但隨著處理器運算速度、VLSI設計及製程技術的提升,H.264/AVC的實現機會就大多了(圖8、9)。  

其中,幾個影響效能較多或新採用的Tools,如下所述:  

‧Quarter-Pixel Accuracy:此功能其實在MPEG-4 ASP已被採納,也是為何MPEG-4 ASP會比MPEG-2編碼效果較好的原因。  

‧Variable Block Size:每一個16x16的Macro Block可因內容的差異,調整Motion Estimation的工作單位,最小可到4x4。如此一來,估算的精準度會增加,得到較佳的位元配置,但如何決定用多大的Block Size為工作單位(此動作稱之為Mode Decision),每個「小」工作單位又須個別做Best Matching,複雜度大幅提升。  

‧Multiple Referenced Frames:稍早的標準只參考前一張畫面(若為B畫面的編碼,則考慮前後參考畫面),H.264/AVC為增加估測的準確度,參考畫面的張數不受過往所限,如此一來,原本就曠日費時的Motion Estimation,就更複雜了。  

‧Integer DCT Transform:在有限Quality的損失下(~0.02dB),達到快速運算、低複雜度與DCT精準度要求。  

‧De-Blocking Filter:以往的De-blocking Filter,只用於將Block邊緣Smooth Out。H.264/AVC則根據不同的編碼現況(如兩個Blocks擁有相同的Motion Vectors,則用較「弱」的Filter),適應性的選擇5個Filters的其中之一,研究顯示,如此一來可增加7~9%的壓縮效果。  

‧CABAC:此為H.264 Main Profile才有的Entropy Coding Tool。利用AC(Arithmetic Coding)的效率、Binarization的簡易處理,定義出399個Context Model,再考慮適應性(Adaptive)的選擇,達到壓縮效果的增進。  

在運用了這些Tools後,H.264在為人們所預期的高壓縮率方面,著眼於軟硬體運算速度、儲存媒介的進步及半導體製程的改良,果然得到2~3倍的編碼進步。  

隨著H.264/AVC標準的正式批准與授權條件公佈,算是完成技術實現的第一步。在觀察全球產業對此標準的接受度的同時,目前已經引起一些重量級的廣播公司、服務供應商和消費電子公司的興趣。在日本方面,包括NHK、TBS、NTV、朝日電視台、富士電視台、東京電視台等日本六家電視廣播公司,已決定採用H.264作為行動數位電視的視訊壓縮標準,並在2006年3月前開始提供行動數位電視服務,日本可望成為行動數位電視的示範地區;DirecTV公司已初步決定,可能在下一代視訊服務中選擇H.264編解碼方式;DVD論壇於2003年2月已經有條件接受H.264/AVC標準為其HD-DVD系統視訊壓縮技術之一;歐洲的DVB也在制定一個廣播DVB-T電視訊號至手持裝置的DVB-X標準,H.264/AVC將會是其視訊編解碼的核心技術;韓國力推的DMB標準亦採用H.264/AVC標準為視訊編解碼的核心技術;在3GPP方面,2003年底,亦選擇H.264/AVC為下一世代的Optional Codec。眾多地區,各種應用,不約而同的選擇該技術,的確也透露出它的未來性。我們舉個例子,H.264/AVC可運用其高複雜度與高效能的特性,提供新的應用領域與商業機會。在傳輸頻道中擬用1Mbps來傳送TV的廣播視訊品質,已經指日可待,所以在以ADSL為基礎的娛樂廣播服務(如中華電信的MOD)將更有競爭力。  

在2003 IBC及2004 NAB上,眾多H.264/AVC編解碼方案的展示,透露出該技術在國際大廠的近期規劃的重要性。包括了Envivio、Harmonic、LSI Logic、Sand-Video、SeaChange、Tandberg TV、TI和UBVideo等,都有成果展出。VideoLocus(已被LSI Logic併購)提出在Pentium IV執行的H.264/AVC編解碼器;Envivio PC based 4Coder Encoder可提供即時的CIF Resolution;UBVideo的H.264/AVC Baseline Profile可以在800MHz Pentium Ⅲ Laptop上處理CIF-Resolution的視訊畫面,編碼速度為每秒49張,解碼速度為每秒105張;Intel的IPP發展計畫,更宣示處理器霸主看好H.264/AVC的未來性。  

HHI的解碼器則可以在ARM922處理器(200MHz)上有每秒6張CIF畫面的解碼速率與每秒6張QCIF畫面的解碼速率;以色列公司Moonlight在2004年CES Show,展出Main Profile 30fps的Decoder,是以Equator或Philips DSP實現的。  

美國Sand Video公司(已於展出後,2004年初被Broadcom高價買下該公司)宣佈成功開發出可對H.264編碼的HDTV視訊進行解碼的硬體設計LSI,產品名為SV-D011。該單晶片產品能夠對1920×1080畫素、30frame/s或者60 field/s的HDTV視訊進行解碼。SV-D011 LSI支援規格為主規格和基本規格,編碼速度最大為30Mbps。目前該公司已經確認LSI的全部功能均可正常工作。在該公司進行的展示中,該LSI對以H.264格式編碼的1920×1080像素HDTV視訊進行了解碼。展示視訊採用固定位速率,編碼速度為7.9Mbps,此時功耗約為1.25W。  

3GPP的行動視訊服務  

3G網路的發展有幾個重要的願景,包括全球漫遊、增加資料傳輸率與通道容量、IP架構及多媒體服務應用等。而3G網路大量普及的重要因素在於殺手級應用的出現。藉由3G的高頻寬與開放IP架構,所建構的多媒體服務應用,應該有機會成為主要的殺手級應用。  

依圖10所示,行動多媒體服務應用可粗分為多媒體訊息、視訊電話及手機TV等服務。3GPP先定義前兩者的應用服務,先以電路交換為傳送平台,再逐漸變成All IP的架構,並與其他有線寬頻網路介接。至於手機TV服務,除了3G(或Beyond 3G)的傳送媒介外,DVB-H或Wi-Fi也都是可能的選擇。  

若以行動視訊的網路架構來看(圖11),從無線存取網路進到核心網路後,可依需求與IP或一般傳統電信網路介接,以串起原有的一些服務。可能的服務包括多媒體訊息、多媒體內容瀏覽、收看網路電視、視訊監控、互動電視服務、視訊電話等。  

多媒體訊息(MMS)可視為一種非即時的多媒體訊息傳送服務,有forward(非直接download)及用電話號碼或E-Mail來定址的特性,架構於IP網路環境,適用的Protocol包括WAP、HTTP、SMTP、RTSP等(圖12)。  

3GPP的多媒體訊息可先參考TS 26.234 V5.5.0及TS 26.140 V5.2.0,描述相關的System、Protocol及Media Codecs。一般來說,3GPP Streaming Client的模組架構如圖13所示。其主要功能模組包括Control、Scene Control、Media Codecs、Transport Layer等,分別敘述如下:  

‧Control部分含有Session建立,利用File、HTTP及RTSP的方式來建立連線,並把Session Description帶給Client;Capability Exchange主要負責協調Client與Server的各種Media codec的支援與其能力;Session Control的部分,則負責連線時各種控制訊息的傳遞。  

‧Scene Control用SMIL(Synchronized Multimedia Integration Language)2.0來呈現,可提供Slide Show、多種檔案格式及同時播放、控制按鈕、播放順序與行為、媒體物件時空位置呈現等。  

‧Media Codec分為Speech(AMR For Narrowband and Wideband)、Audio(MPEG-4 AAC-LC and LTP)、Synthetic Audio(Scalable Polyphonic MIDI)、Video(H.263 P3L10 and MPEG-4 SP L0)、Still Image(JPEG)、Bitmap Graphics(GIF 87a/89a and PNG)、Vector Graphics(SVG Tiny and Basic Profiles)、Text(XHTML Mobile Profile,SMIL)及Timed Text等。  

‧Transport Layer主要Leverage RTP/UDP/IP及Mobile Network的Layer1 and 2。  

在無線通訊領域最熱門的話題,除了3G標準、技術與標案外,另一個引人注目的就是2002年10月NTT Docomo與NEC合作,利用MPEG-4的Codec,搭配原有H.324視訊電話協定,所推出的無線視訊電話。利用手機不到2吋的螢幕,透過二代無線網路與遠端親友做面對面的溝通。姑且不論目前的品質與畫面大小是否滿足大家的需求,但此方面卻透露出無線視訊電話此類產品的未來性。目前國內外有多家研發MPEG-4晶片的廠商,就是冀望此類產品的應用。同樣地,目前也有很多人談及手機結合PDA的產品趨勢(其實目前已有產品問市,只是尚未成為市場主流),視訊電話應用其上是最自然不過了。  

3G-324M是由H.324演進而來,利用3G Radio Access Network結合Circuit-Switched Network,提供64Kbps點對點的行動視訊電話服務(圖14、15)。  

如同H.324的PSTN視訊電話一般,3G-324M包括Video Module(I/O、H.263、MPEG-4 and H.261)、Audio Module(I/O、3GPP-AMR、G.723.1)、Data Application(T.120)、System Control and call set up(H.245 and Q.931)及Mux/Demux(H.223)等。  

隨著3GPP All IP的環境建立,以SIP為基礎的IP視訊電話是一個最終的解決方案。與有線SIP Video Phone的架構幾乎一樣,但為了因應Mobile Network的環境,Rate Control、Error Resillence/Concealment、Mobility and Power Saving是需要特別考量的。  

多家廠商積極發展視訊通訊  

行動電話經過這幾年的蓬勃發展,目前的需求已經成長趨緩;手機的單價下跌,業者所推出的機種無不功能五花八門,以博得消費者的青睞;電信業者從每個用戶所得到的營收(ARPU,Average Revenue Per User)也逐步下滑,唯有服務加值應用才能持續刺激消費。  

舉一些晶片商與電信服務商的例子,來點出行動多媒體的未來性。首款整合型QUALCOMM Qtv解決方案將於2005年推出(圖16),首先發佈的產品將包含QUALCOMM MSM6250、MSM6500、MSM6550 Mobile Station Modem(MSM)、寬頻CDMA(WCDMA),及CDMA2000 1xEV-DO晶片組解決方案。QUALCOMM的Qtv解決方案是一種多功能軟體解碼器,使行動設備可連續播放、下載及重播多媒體內容。Qtv解決方案是QUALCOMMLaunchpad系列的一部分,該系列具有多媒體、互通性、定位、用戶介面及可卸除式儲存功能,包括QUALCOMM gpsOne解決方案,是全球最廣泛使用的手機之全球定位系統技術。QUALCOMM表示,其Mobile Station Modem整合解決方案將加速Windows Media編解碼器,並降低電量消耗,進而提升用戶的數位體驗。Windows Media目前已擁有700多種設備支援,包括DVD播放器、家庭影院系統,以及汽車音響及手機等。  

Verizon Wireless於2005年2月底時啟用了一項名為「Vcast」的視訊隨選服務,讓消費者隨時下載短片與音樂錄影帶,在手機上觀賞。除了手機的螢幕較小之外,在畫面與音質的呈現上,皆與家中的電視無異。英國的分析師Neil Mawston更預言手機收看視訊的服務會在3~5年內蔚為風潮(圖17)。  

日本的IT產業一直是執世界牛耳,3G的商業運轉與加值服務,也是最先佈置的。在3G行動多媒體的應用方面,三大行動通訊服務業者NTT DoCoMo、KDDI及Vodafone K.K.都積極投入,以搶佔市場(表2、3)。  

另外,南韓的SK Telecom也開始推動手機收看數位電視的相關服務,目前共提供十四個頻道的衛星電視可以讓手機用戶觀賞。美國的Direct TV也打算把衛星電視的節目,拓展到車內電視與行動手機族群。中華電信的行動影音形成了兩種商業模式:  

‧在自建的影音串流平臺上邀集內容業者合作,並在emome手機網上成立「行動放映館」頻道,提供用戶在手機上以Streaming播放方式收看影音內容。  

‧讓用戶下載影音播放軟體,再將影片下載儲存至用戶手機中收看,如「uGolive」服務。  

刺激3G行動多媒體產業發展  

影響3G行動多媒體產業蓬勃發展的因素有哪些?筆者以為應從下列諸點觀察:  

‧寬頻與3G網路的建置成熟:不論是有線或無線,先要有完善的網路建設(Infrastructure),才能談到上層的應用。尤其是視訊電話,需要雙向、即時與對稱的頻寬,延遲、畫面數(Frame Rate)太低的現象,是無法符合消費者的要求。  

‧降低成本與品質提升:利用ASIC或DSP的加速壓縮或保密法則(Encryption Algorithms)的運算,並持續降低成本。  

‧標準化與互通性:此為通訊產品不可或缺的條件。目前H.264是需注意的標準,SIP/RTSP是常用的通訊協定,IMTC(International Multimedia Teleconferencing Consortium)算是較活躍的互通性測試組織。  

‧技術的演進:壓縮、保密(Security)、信令與控制、傳輸等的技術演進,將促使視訊電話加快商業化的腳步。  

‧整合性產品的開發:將各種多媒體的網路溝通模式整合,以簡化使用並擴大功能。  

‧創造應用:遠距醫療/教學、在家通勤、遠端監控/保全、上網購物等應用,將可直接推動行動多媒體的普及。  

(本文作者任職於工研院電通所軸纜與視訊技術部)  

 

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!