提高傳輸頻寬與散熱效率 處理器打造全方位4K體驗

2015-02-09
隨著行動裝置逐漸成為你我的生活重心,顯示器的品質優劣也就關係著各種視覺體驗,包括觀賞高畫質影片、感受高品質遊戲、瀏覽網路資訊、照片、文字,以及沉浸式使用者介面。當螢幕解析度越高,各種體驗便越具吸引力,因此許多行動業者皆爭相採用創新、先進的顯示器技術,其中4K超高畫質(Ultra HD)技術將成未來市場焦點。
行動趨勢不僅提高4K普及率,也將改變4K的內容產製與消費習慣。目前有相關晶片商推出新一代處理器,藉以實現端到端4K Ultra HD的平台,讓消費者無論在行動裝置或Ultra HD電視上,均可享受各種高畫質4K影片內容。

4K體驗除了影片之外,亦包括高階遊戲等其他類型內容,若要開創全方位4K體驗,除了要解決多種引擎的處理需求增加、流量提高帶來的大數據頻寬要求兩大挑戰外,同時也得考量行動裝置的功率與熱能因素。

全方位4K體驗面臨兩大挑戰

如圖1所示,行動裝置處理器中每一處理引擎專職處理特定內容。為因應各式4K內容的處理需求,多種引擎必須升級,例如繪圖處理器(GPU)須升級才能滿足4K解析度遊戲;顯示器引擎也要藉由升級以驅動4K解析度的行動裝置顯示器。

圖1 行動處理器中包含的各式專用處理引擎

從1,080p升級至4K,最多需要四倍數據頻寬(圖2),系統頻寬最高也得增加四倍,以應付系統單晶片內各處理引擎產生的流量。

圖2 4K較1080p需要四倍的數據頻寬

市面上已有新款系統單晶片運用理想的行動異質運算功能,以滿足4K技術增加的處理需求,同時維持低功率;再藉由高效能系統單晶片架構管理系統資源以達到數據頻寬增加的需求,且不會超過行動裝置的功率與熱能上限。

以高通(Qualcomm)Snapdragon 810處理器為例,其對現有客製化引擎的功能進行升級演進、採用新式專用引擎,並協調多種引擎,以創造出全方位4K體驗。舉例來說,為播放與拍攝4K影片,該處理器配備影片專用引擎,能夠以每秒三十格的速度編解碼HEVC影片。

圖3即說明了在滿足影格數要求的情況下,中央處理器(CPU)與影片專用引擎執行HEVC解碼功能時的耗能差異,解析度愈高、編解碼愈複雜,專用引擎對於解碼效能的影響愈大,4K解碼即為一例。

圖3 影片專用引擎與CPU執行HEVC解碼功能耗能對比

再者,要支援4K影片拍攝,處理器便要處理更多畫素,因此須要緊密協調相機與影片專用引擎,以拍攝與壓縮儲存檔案,為以高影格率拍攝4K影片,目前市面上新款處理器運用雙影像訊號處理器(ISP)來因應吞吐量與品質提升,拍攝更清晰、更高解析度的照片,並在低光環境的攝影功能裡,提供先進的前製與後製降噪功能。

事實上,市面上的處理器也為其他專用引擎增加各種影像改善功能,包括顯示器、CPU、GPU、數位訊號處理器(DSP)、相機與影片引擎,例如顯示器引擎可執行多種色彩校正及畫面調整功能,具備高品質後處理算法創造絕佳畫質,包括畫面調整、改善色彩/對比/比例/亮度等;並能於顯示器的標準色域以及延展或收縮色域之間進行繪製。

隨著內容與相關用途而異,這些引擎能以最低的功率合作執行所需功能,創造理想的相片畫質。在計算攝影情境中,處理器可運用CPU、GPU、DSP的異質運算功能,來執行先進運算技術,產生比原始拍攝畫面更豐富、更生動的效果。

新款的處理器如Snapdragon 810也能提供使用者4K級沉浸式行動遊戲體驗,其內置的Adreno 430 GPU引擎效能較前一代提升三倍,因而能在智慧型手機與平板電腦上打造4K專業遊戲體驗。

同時,Adreno 430也是首個支援硬體曲面細分的商用行動GPU,讓畫面更加寫實細緻,同時降低記憶體頻寬與耗能需求。

硬體曲面細分減輕記憶體負擔4K影音輕鬆達陣

過去多數3D遊戲為達視覺效果,程式設計師必須在每個物件上加入大量幾何細節,遊戲中的人類或怪獸角色的幾何網格愈密集,樣貌就會愈寫實。而在傳統行動GPU之中,提升視覺效果所需的額外幾何元素是由CPU寫入系統記憶體,再由GPU讀取並進一步處理。

不過這種傳統處理方式的問題在於,專業遊戲所需的記憶體頻寬與耗能程度可能超過負荷,況且在被動式冷卻的輕薄行動裝置中,記憶體頻寬與熱能上限大幅影響程序員編程可用的幾何複雜度,但硬體曲面細分可解決這項問題,透過提高GPU在晶片上產生幾何元素的能力,毋須額外將數據轉移至系統記憶體中。

硬體曲面細分可顯著降低頻寬與耗能,圖4說明運用曲面細分後,為線框圖與最終圖像增加的細節,在這張大黃蜂的圖像中,硬體曲面細分為頻寬最高省下360Mbit/s,記憶體最高省下20MB,遊戲規模若更龐大,內存記憶體的節省空間更能以GB計算。也因為曲面細分技術提供更多細節,能大幅改善遊戲體驗,對4K與非4K內容均明顯有益。

圖4 曲面細分技術(上圖為使用前;下圖為使用後)能創造更寫實、更細緻的圖像。

值得注意的是,目前新款處理器還能提供端到端的頂級影音內容保護,採用Snapdragon StudioAccess(圖5),其中包含運用安謀國際(ARM)TrustZone技術,在獨立於高階作業系統之外的安全執行環境內運作的安全應用。

圖5 Snapdragon StudioAccess

以硬體為基礎的接入控制單元分布在系統單晶片的不同元件內(包括影片、顯示器、加密引擎、記憶體控制器及其他模組),這些單元彼此協調,為壓縮與無壓縮影片緩衝保護系統記憶體。

另外,SecureMSM平台負責提供晶片組的基礎安全機制如安全開機,這項平台擁有專用硬體加密引擎,能以節能方式解密數據,並具備高吞吐量,滿足4K內容的高頻寬需求。

Snapdragon StudioAccess為內容保護需求提供預先整合的解決方案,如高通就與SCSA合作,在Snapdragon 810處理器內製作原型,運用StudioAccess的資安能力,打造由SCSA定義的影片格式的端到端保護。

圖6 高效能系統單晶片架構可克服數據頻寬挑戰。

為滿足高數據頻寬需求,又得顧及行動裝置的功率及熱能上限,高效能的系統單晶片架構便成為新款處理器的主要配備(圖6)。

最佳系統頻寬增幅

目前市場上處理器的系統記憶體頻寬最高可達25.6GB/s,形同在行動裝置封裝內達到與筆記型電腦相當的頻寬。為善用DRAM頻寬增加的優點,系統互連拓撲並經過改造與拓寬,以容納處理引擎各種延遲與吞吐量需求,例如新匯流排拉近Adreno GPU與DRAM的連結距離,進而減少延遲與增加頻寬。

為支援4K技術,除了提高記憶體頻寬,也要改善外部介面吞吐量,例如顯示器串列介面(DSI)和吞吐量經過改良後,即可支援裝置內建的4K顯示器,處理器也能同時透過DSI驅動主要顯示器,以及透過HDMI驅動外部4K電視;另外亦支援eMMC v5.0與通用快閃記憶體儲存(UFS),將4K影片儲存在Class 10 SD卡中。

先進記憶體管理技術

為降低耗能,記憶體控制器藉由減少記憶體對常規性任務的處理,來進行優化,為各種引擎的吞吐量及延遲需求提供高服務品質,同時增加記憶體使用效能。

處理器可以在許多處理引擎之中,建置智慧快取機制,壓低時常存取DRAM的需求,例如Adreno 430內增加快取記憶體,以降低記憶體頻寬與耗能需求。Snapdragon 810亦支援內部FBC,往來DRAM時自動壓縮與解壓縮數據,故能降低記憶體流量與耗能。

電源管理技術

要實現有效的電源管理,處理器可透過建置精密電源管理演算法,隨工作量多寡應變,再運用動態時脈與電壓調整(DCVS)範圍的技術,隨時控制處理引擎的時脈頻率與電壓,例如Adreno 430 GPU的DCVS電源控制層級更加精細,能夠以額定電壓狀態執行多數用途,故可省電。

上述的多種Snapdragon引擎具備創新省電技術,例如顯示器引擎運用動態背光(CABL)演算式,隨顯示圖像調整背光明暗,最高可省電三成,亦不影響視覺效果。據了解,目前已有廠商為外部FBC設計專利壓縮技術,顯示器數據最高可壓縮為一半,亦無損視覺效果,再傳輸至顯示器面板。

Adreno 430 GPU亦提高圖像效果的Z-reject比率,Z-reject意指畫素若隱身在其他畫素背後,系統就不處理,故Z-reject比例提高代表每一畫素耗能減少,從而提升性能表現。 事實上,對行動裝置系統業者來說,打造端到端4K解決方案並不容易,尤其是內建的系統單晶片必須在相同時間範圍內,處理四倍畫素,故大幅提高系統資源需求。

晶片廠為克服行動裝置上的挑戰,以系統式行動設計同步提升系統單晶片所有層面,亦運用最合適的異質運算方式,滿足低功率4K處理需求,並打造高效能系統單晶片架構,智慧的管理系統資源,不僅符合高數據頻寬所需,亦不超過行動裝置的功率與熱能上限。

(本文作者為高通技術行銷總監)

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!