HDMI協會揭示消費電子產品未來

視訊編碼技術標準不一　DRM落實路迢迢

2007-07-19

鍾慶豐

多媒體資料安全須業界全面納入

多媒體資料和一般網路資料有極大的差異：一般資料固有的編碼安全技術已行之有年，並通過許多殘酷的考驗，因此其安全強度與技術都已成熟；反觀數位多媒體，卻因仍未獲得各界的支持，還有很長一段路要走。

矛盾的是，儘管數位多媒體近年來頗為風行，卻礙於其成員廣泛且具未來擴充性，因此目前並沒有明確定義。但就一般人的認知，數位多媒體往往包含文字、圖片、影像、動畫、音訊與視訊等。又因視訊與音訊為多媒體的重心，因此目前的多媒體安全研究焦點幾乎都集中在視訊(Video)的安全保密領域。

而多媒體安全技術涵蓋多個領域，包含多媒體編碼技術(Multimedia Encryption)、多媒體資料隱藏(Data Hiding)、數位浮水印(Watermarking)、多媒體指紋技術(Fingerprinting)與資料驗證(Authentication)等方面。這些技術都可以利用單一或是結合方式搭配使用，但仍要考量多媒體資料本身的忍受度。雖然數位多媒體的安全需求自90年代便一直被討論，但因多媒體安全的解決方案涵蓋資訊技術、立法、授權等領域，一時之間也無法提出一個完整而有效的保護技術。

主因是上述的保護機制不只考慮軟體與硬體，更須立法明確規範。而最重要避免盜版的方法之一，便是授權微利化，摒棄海撈的想法，利用合理利潤與明確授權，將有助減少使用者轉向盜版。

數位影像/視訊處理的安全需求

在多媒體領域中，重視的多媒體資料型態主要為數位影像(Digital Images)與數位視訊(Digital Video)，因此多媒體安全議題的研究也多環繞在其上。

如果將這兩種資訊視為一種資料位元串流(Data Bit Stream)，那使用在多媒體資料方面的編碼技術與一般資料的編碼技術並無差異，因此要編碼影像或視訊，只要將影像或視訊資料直接丟入目前常用的編碼系統如Data Encryption Standard(DES)、IDEA或AES等即可，而這種型態的靜態影像或視訊編碼方式，就稱為自然編碼演算法(Naive Algorithm)。

可惜的是，這兩種多媒體資料型態與一般資料型態並不相同，維持壓縮比、大資料量與視訊品質都是其在加入安全技術時的重要考量關鍵，因此自然的編碼演算法並不適合直接套用在多媒體上。影像與視訊編碼須要滿足四個需求，分別是對一般數位影像處理具有抗性，亦即不被輕易用數位影像處理過程移除、處理速度、大影像壓縮比或使檔案變大與視覺品質的維護。

數位影像編碼對安全的需求，可以分成低階安全層級(Low-level Security)與高階安全層級(High-level Security)。在低階安全編碼等級裡，只是降低影像品質，但影像內容仍隱約可辨；而在高階安全編碼等級裡面，影像內容是完全被雜訊(Noise)打亂，一般人並無法得知影像訊息。只是在處理數位影像的編碼過程時，因為影像與視訊內容比其他資料型態，在內容上更具有統計的關連性，也就是鄰近像素或前後畫面具有高度相似性，因此應該避免位元依序編碼(Bit-by-bit)的方式。

目前用在靜態影像編碼方面的重要方法包含SCAN-based的方法、傅利葉方法(Fourier-based Methods)、渾沌理論(Chaos-based Methods)與四分樹法(Quadtree-based Methods)等。雖有時會希望將這些影像編碼方法直接套用在數位視訊，但一般的結果卻是不盡理想。

原因之一，是數位影像屬於長度與寬度的2D處理觀念，但視訊卻屬長度、寬度與時序的3D處理觀念。少了時序的應用，往往會使視訊處理結果無法達到目前其他現存方法的品質。因此在處理視訊時，應考量它是時間的變數。

數位影像具有大量資料特徵，礙於多媒體資料龐大，其傳送往往須要壓縮，因而常見的視訊資料壓縮方式包含MPEG系列(MPEG-1、2、4)與ITU-T的H.26X系列(如H.261、262、263/263+/263++)、Motion JPEG以及JVT的H.264/AVC壓縮標準等。因此開發視訊的編碼演算法，要考量到是否可應用在這些壓縮領域。在常見的幾種視訊壓縮方法裡面，包含了選擇性編碼演算法(Selective Encryption Algorithm)、VEA方法(Video Encryption Algorithm)、階層式編碼方法(Hierarchical Algorithm)等。

選擇性編碼方法的運作原理，主要是建立於I畫面(I-frame)對整個P/B畫面具有重要貢獻，因此為了避免將整個視訊編碼所須耗損的運算成本及降低運算複雜度，有人建議將I畫面編碼起來，以保護視訊內容的機密。不過經由Agi及Gong研究發現，只編碼I畫面所得到的安全效果並不理想，因為除了I畫面外，另外P/B畫面中所包含的未編碼I區塊(I Block)可被利用來重建視訊。因此，搭配選擇性I畫面編碼的措施有三個，一個是將P/B畫面中的I區塊也編碼起來，另一個是讓MPEG編碼器不在P/B畫面中產生I區塊，或者增加I畫面數目並將之編碼。這些方法都會使視訊安全層級得到提升，但所付出的代價卻是壓縮比的降低。

圖1 選擇性編碼架構之運作流程

另外，在Shi-Bhargava提議的VEA視訊編碼方法裡，則是利用修改DCT轉換係數的方式提高安全性，且為了提高編碼速度，其編碼方法裡只用XOR運算。但上述方法有兩個主要缺點存在，首先是AC係數會被改變，其次是這種方法在對抗已知明文攻擊(Known-plaintext Attack)上仍顯薄弱，因此VEA方法對一些要求高安全性的視訊應用領域並不適用。較詳細的視訊影像編碼方法可參考M. Yang、N. Bourbakis與S. Li的研究資料。圖1為一個媒體選擇性編碼的架構。

分層保護依對象而異

在多媒體的分層保護方面，數位多媒體安全保護領域依據其對象而有所不同，大致上可分成端點軟/硬體之保護、傳送封包流的保護與媒體成分的保護三種。

在端點軟/硬體之保護上面，IP核心(IP Core)產業概念的興起與IBM、英特爾(Intel)等大廠在智財權上的動向則具有重要主導因素。例如在英特爾所主導的保護方式裡，主要放在預錄媒體與可錄媒體的保護等問題--也就是4C實體的關心重點，並分別針對這兩種重要媒體型態主導制訂預錄媒體之內容保護(Content Protection for Prerecorded Media, CPRM)規範及可錄製媒體之內容保護(Content Protection for Recordable Media, CPPM)規範。前者主要是適用在保護DVD影音方面，而後者則是將重點放在可燒錄DVD、SD記憶卡等其他可儲存裝置。

在這些CPRM/CPPM規範裡面，其所定義的編碼方法是可更新式，以因應新時代的變化需要(可參閱英特爾網站)；至於在多媒體資料的傳送保護上面，除可藉由RTP本身提供的編碼機制之外，亦可參考SRTP的發展，SRTP主要是針對串流服務等需要使用到RTP協定的應用而來。

在一般傳送媒介的觀點上，IPSec、SSL/TLS是常用的安全協定。但是在多媒體傳送上，其焦點放在RTP/RTCP等即時傳送協定(Real-time Transport Protocol)的安全機制上。基本的RTP協定(可參考RFC 1889)本身就有提供RTP封包編碼(Encryption)能力，並可將封包分成有編碼與無編碼兩部分，其內定的編碼演算法是DES的CBC模式。而為了防止RTCP的標頭遭受已知明文攻擊，其標頭被以三十二位元的隨機字首加以混淆保護。

DES CBC模式在解碼方面有隨機存取(Random Access)的屬性，因此遺失編碼封包只會影響封包本身及其後的封包解碼，而不會影響全部。這對具有遺失敏感性的多媒體資料串流來說，是一項很重要的特徵，它使這些多媒體資料不必因為少數封包的遺失導致全部的封包都得重送。除了DES CBC模式之外，RTP也允許使用其他的編碼演算法，只是這些演算法可能不是全部適合用在即時傳送上面。

最後一個多媒體內容保護層次，是在媒體成分的保護方面，包含如MPEG-4 IPMP等整體性的標準設立、多媒體選擇性編碼的方式、移動向量、轉換係數等編碼視訊重建因素等保護方式，只是這種媒體成分本身的安全技術有不損及壓縮比的考量，因而在整體的整合應用上面，將上述三種媒體保護策略整合在最上層，就成為業界所熟知的數位版權管理(Digital Rights Management, DRM)系統。

DRM缺陷難克服

DRM系統的開發，在整個多媒體防護技術上，屬於最上位體系，其包含各種對目前媒體應用所能提供的功能服務，與其說它是整合的實體，不如將它視為是一種如H.323傘狀結構的標準。

圖2 DRM系統運作概圖

它的困難點至少有四個：多媒體影音編碼技術的變化快速、許多多媒體防護技術仍處不成熟狀態、研發整合DRM系統曠日廢時、沒有一套DRM系統可以畢其功於一役，同時適用有線網路、無線網路以及各種多媒體應用狀況。DRM系統運作概圖如圖2。

由於以上的困難點難以克服，因而不論從技術層面或歷史上來看，都可得知其發展不易。例如在DRM系統研究上較重要的網路標準組織機構主要有全球資訊網論壇(World Wide Web Consortium, W3C)、網際網路工程工作小組(Internet Engineering Task Force, IETF)、結構化資訊標準促進組織(Organization for the Advancement of Structured Information Standards, OASIS)、開放行動聯盟(Open Mobile Alliance, OMA)以及MPEG群組(Moving Picture Experts Group)等。

W3C可說是全球資訊網的發源地，成員包含全球資訊網(WWW)的開國元老Tim Berners-Lee。目前該組織亦涉獵DRM系統之研究，只可惜並未取得比ODRL更多的成就。

至於IETF則算是網路技術與管理核心技術的祖師爺，在多年前IETF曾經成立關於網路DRM方面的研究工作團隊，但可惜此專案在2003年初便被關閉，DRM的標準制定工作功敗垂成。IETF之所以放棄DRM標準的制訂，主要原因是DRM在IETF的觀點裡屬於應用層面(Application Layer)而不屬於IP效能，因而IETF對其不感興趣。但少了IETF的加持，讓DRM整合之路變得更加艱辛。

OASIS起源自90年代，當時稱為SGML群組，在DRM領域亦曾貢獻過不少心力。不過因為OASIS在2004年夏季之後不再致力於DRM的研究，目前在DRM領域仍致力整合實作的最大群組仍屬MPEG群組。

另外在無線工業上，OMA是無線工業在互連與標準制定方面一個非常重要的成員，他們與前述團體不同的地方在於，其乃基於ODRL的基礎。不過OMA DRM有許多分頭標準，許多無線工業廠商都有自己的一套，如諾基亞(Nokia)便是其一。早期OMA的實作不具DRM系統的特徵，其主要措施只是阻止人們彼此共享資料。不過發展至今，目前無線領域的OMA DRM標準仍處於渾沌未定狀態。

最後一個MPEG群組是ISO/IEC底下的工作群組，其主要領域在視訊與音訊的CODEC標準制定方面。相較於Real Networks或是微軟(Microsoft)的研發陣容，MPEG的會員不多，且多半來自歐洲的學術團體。但是其所提出的標準裡，有一些卻成功的成為世界視訊/音訊標準，如MPEG-2及MP3等。

MPEG群組非常關心DRM議題，他們嘗試將DRM觀念融合在MPEG CODEC系列標準裡，如MPEG4 IPMP或MPEG-21第五部分(Part V)所定義XRML-based的版權表示語言，以及在第六部分(Part VI)所定義的版權資料目錄，均顯示了MPEG群組在DRM領域的企圖心。

因為許多當初制定DRM系統的團體已打退堂鼓，剩下的MPEG群組的DRM系統目前尚未成行，因此市面上只剩下業界為自己產品所量身訂作的DRM系統，如微軟、奧多比(Adobe)等，故可稱之為群雄割據之局，要一統DRM的局面還很遠。

保護新一代視訊標準同成議題

在HD-DVD、藍光(Blu-ray)等新一代的視訊標準裡面，H.264/AVC CODEC是官方指定的編碼標準；此外，H.264/AVC在HD廣播領域亦將取代現有的MPEG-2標準；另外在新的衛星DVB標準裡，H.264/AVC亦是擔任主要的CODEC角色，這些重大動作都使H.264/AVC成為當紅炸子雞，但H.264/AVC在視訊表現上面或許有很傑出的成果，卻未能在多媒體安全領域一統天下，問題就出在視訊編碼(Video Encryption)技術的研發與一般資料的編碼研發有些差異。

這些不同處包含大量資料集結構、即時處理的需求以及特殊編碼結構的需要等。因此在發展視訊編碼技術時，這些差異便成為研發時需要考慮的因素。一個好的視訊編碼方法應該要能滿足以下幾點：不損及壓縮比(Compression Ratio)、具有一定安全強度(Security Strength)、不影響視訊的格式順從、能應用在即時處理、具傳送錯誤抗性。

其中即時處理與傳送錯誤抗性主要是考量到網路應用及傳輸上的需求，因此如果是在離線使用的儲存裝置裡進行視訊安全編碼，則可暫時忽略。

而影響視訊編碼技術開發的原因主要有視訊標準的版本變化速度，亦即視訊編碼結構的改變、在應用上整體格式順從的問題、大量資料所導致的運算成本、兼顧密碼強度與運算複雜度之間的衝突。

選擇性編碼受重視

基於以上因素，近年來選擇性編碼(Selective Encryption Algorithms)議題頗受重視。選擇性編碼是將視訊的重要內容部分加以編碼保護，其他部分則否。其優點在於降低視訊編碼複雜度與運算成本、減低對格式順從的衝擊以及在實務應用上的考量。

但是其缺點包括密碼強度不足、重要視訊部分的認定問題等，不過依據I.Agi及L.Gong的研究發現，選擇性編碼在MPEG系列的視訊上面，並不是一個很好的編碼選擇。有鑑於此，對於H.264/AVC的視訊保護，仍可建基於以往的視訊標準安全性研究，如Z.Liu及X.Li就認為移動向量(Motion Vector, MV)對視訊重建有重要的貢獻。

再將以往的研究綜合起來，就可發現相同的技術原理依舊可在H.264/AVC標準上發揮作用。目前常用之選擇性編碼技術，作用層面集中於編碼DCT轉換係數、大量的I畫面編碼需求、巨集區塊(Macroblock)中的移動向量或P/B畫面中的I區塊。業界提出的H.264/AVC新編碼概念的看法，便是基於前人的研究上。新的提議是將轉換係數與移動向量視為視訊的重要部分加以保護，因此在其編碼策略裡面，除原本使用的Intra-prediction技術之外，還打亂Inter-prediction並編碼轉換係數與移動向量(MV)編碼，以強化視訊保密。

還須整合之未來

多媒體影像/視訊的安全議題，處處存在著安全性與運算複雜度之間的角力平衡，這方面目前業者們仍在努力之中。一個退而求其次的方法，就是各廠自行開發自己產品所適用的安全技術，等到各種技術都純熟後，或許就可以看到單一制式卻放諸四海皆準的管理新標準。如果真有那一天，那都要感謝科技先輩的努力，後人才能有此成就。正如艾薩克．牛頓爵士所言：「我看得更遠，只因我站在巨人的肩上」。