省電小巧搭配高頻寬I/O　FD-SOI製程FPGA另闢蹊徑

2021-09-03

Aakash Jani

2020年，通用型FPGA市場更加多元化，市場規模成長約為10%。CertusPro-NX是萊迪思半導體在18個月內採用Nexus技術平台開發的第四款產品，與之前的Certus-NX相比，邏輯單元從17K提升到了96K，可用於實現各種功能，應用領域包括5G蜂巢式網路、人工智慧和物聯網。這些市場不斷發生著變化，而FPGA則能提供ASIC不具備的強大靈活性。

此系列新產品有兩種型號：CPNX-50K有52K邏輯單元，CPNX-100K則有96K邏輯單元，也是首發的工程樣品。如圖1所示，後者型號有一個支援LPDDR4 DRAM的可程式化設計I/O，這是同類FPGA中首見。同時，由於內部記憶體容量拓展了三倍，讓CertusPro-NX在進行儲存密集運算時可降低功耗。

圖1 CertusPro-NX區塊圖。包含7.3Mb的晶片上記憶體、156個18×18乘法器的DSP模組、可程式化設計邏輯以及8個靈活的10Gbps SERDES通道(可配置連接DisplayPort或CoaXPress)。

該系列元件採用了28nm FD-SOI製程。儘管以往許多人對這個選擇存在質疑，但CertusPro-NX達成了功耗和軟錯誤率方面的標準。除了可程式化設計邏輯之外，其擁有硬核模組也可以降低功耗，還包括一個10G乙太網路埠和一個四通道PCIe Gen3控制器。廠商還尤其關注位元流配置模組，因而其元件的啟動速度相當快，可在不到30毫秒內完成配置。

鎖定機器視覺和網路邊緣AI

CertusPro-NX除了拓展可程式化設計邏輯架構外，還強化了該平台的AI功能。新元件使用了7.3Mb的內部記憶體，用戶可以載入輕量化的神經網路來辨識物體、監聽關鍵字或偵測異常行為。不過硬體只是設計的一方面，萊迪思的sensAI軟體套件能與Caffe、TensorFlow、TensorFlow Lite和Keras等框架配合使用，且擁有AI編譯器的支援。這一經過驗證的解決方案為眾多用戶提供了功耗和資源效率充分優化的人工智慧應用。

網路邊緣的機器視覺應用不僅要求使用硬體來實現神經網路，還需要感測器相容、感測器融合和圖像預處理等功能。透過可程式化設計I/O和SERDES模組，便可為用戶提供足夠的靈活性。例如，許多高解析度影像感測器都採用SLVS-EC介面，這是許多網路邊緣AI加速器所缺少的。可程式化設計SERDES還支援各種將資料從網路邊緣傳輸到系統內部的標準，包括CoaXPress和10G Ethernet。

CertusPro-NX的晶片上記憶體大小遠超同類產品。由於DRAM操作會增加功耗並降低吞吐量，所以如果所有權重都儲存在晶片上，神經網路就能以最佳狀態運行，且能夠最大限度地減少DRAM存取。此全新FPGA可以儲存多達100萬個8位權重，可以在不存取DRAM的情況下運行更大的AI模型，進而降低功耗。

當這個FPGA確實需要存取DRAM時會使用可程式化設計I/O模組，它支援LPDDR4和速度達1,066Mbps的DDR3記憶體。CertusPro-NX的面積僅為81mm²，小尺寸FPGA進一步增加了設計的可用空間，讓OEM用戶得以增加更多功能或縮小設計尺寸。

呼應工業物聯網場景需求

最新一代工業物聯網的特點就是大規模自動化，這得益於連接性和資料分析方面的進步。為實現自動化分類和包裝等任務，智慧工廠需要數千台物聯網設備，每天生成和處理的資料量達TB級，驅動這些設備的晶片必須尺寸小、功耗低且可靠性高。與市場上基於CMOS製程的FPGA相比，CertusPro-NX採用了FD-SOI來降低功耗。假設設計需要65K邏輯單元、使用了75%的DSP和記憶體、運行兩個5Gbps的SERDES通道。對於在85℃接面溫度和125MHz頻率下運行的該設計而言，CertusPro-NX的總功耗(動態+靜態)比Artix-7少75%，比Cyclone V GT少65%，如圖2所示。

圖2 FPGA功耗比較。LC為邏輯單元。此處的功耗估算是以5Gbps雙通道SERDES應用在125MHz以及85℃接面溫度下，資源使用率為75%時計算得出。
資料來源：萊迪思

這些數據展示了FD-SOI製程帶來的功耗優勢，藉由在載板中使用絕緣層，與其他28nm Bulk CMOS產品相比，漏電流最多可降低75%。而漏電流正是產生靜態功耗和待機功耗的主要因素。

隨著OEM廠商透過提高功耗來提升其產品效能，一般FPGA將更快地超過其接面溫度臨界值。因而CertusPro-NX將擁有更多功耗和散熱空間，從而有助於OEM廠商縮減系統尺寸，降低散熱管理成本。此外在接面溫度以下運行的系統，不需要安裝容易出現機械故障的風扇。

FD-SOI還擁有消除單粒子翻轉(SEU)錯誤的額外優勢。當輻射粒子穿過元件並與記憶體或暫存器單元相互作用時會發生這種錯誤，這會導致元件邏輯狀態錯誤翻轉，從而破壞記憶體或資料路徑。與Artix-7相比，CertusPro-NX可降低99%的軟錯誤數量，無需使用軟錯誤偵測邏輯和糾錯代碼。這種方法既提高了系統可靠性，又簡化了客戶設計。

CertusPro-NX的平均故障間隔時間(MTBF)是Artix-7的110倍，可滿足汽車和醫療系統對可靠性的需求。由於不需要經常進行現場調整，因此還可以降低維護成本，保證關鍵操作的正常持續運行。

OEM廠商通常需要將FPGA與其他系統零組件搭配，這要求晶片間介面擁有高頻寬，防止資料流程瓶頸。此元件具有四通道PCIe Gen3控制器，每個通道速度比PCIe Gen2快了50%。更高的SERDES頻寬結合更新的PCIe技術，將能突破晶片互連的瓶頸。

提高效率滿足5G設備應用

為了更好地服務於無線網路，基地台OEM會將控制平面和使用者平面分開。控制平面是模組化的，因此無線網路供應商可以將其功能拆分到多個晶片中，或將它們整合到單一晶片上，由其處理各種任務，包括身份驗證、用戶端(UE)會話管理和統一資料管理。儘管CPU可以執行所有這些功能，但效率不如FPGA。據業界估計，OEM廠商需要更高效率的硬體，因為每個5G基地台的功耗比4G基地台高70%。考慮到靈活性和功耗限制，基地台OEM通常需要FPGA來協助補強處理器或ASIC。CertusPro-NX的功耗低於Artix-7和Cyclone V GT，簡化了基地台的散熱管理。

5G小基地台空間狹小，資料流動量大。CertusPro-NX在具備SERDES功能的同類晶片產品尺寸最小，非常適合小尺寸設計且資料速率不會受到限制。CertusPro-NX擁有的75Gbps SERDES頻寬比Artix-7高36%，是Cyclone V GT的2倍以上。對於封包管理等高頻寬功能，憑藉其更大的SERDES頻寬可提供更高的吞吐量，以及更佳的面積效率。

新技術結合低成本優勢

CertusPro-NX主要是鎖定機器視覺、工業物聯網、5G蜂巢式網路和其他不斷增長的市場需求。該元件經優化的內部記憶體和LPDDR4可最大限度地減少神經網路等儲存密集型操作的功耗。FD-SOI技術降低了功耗和故障率，讓下一代元件更可靠且運行成本更低。新款FPGA的10Gbps SERDES和產業領先的封裝尺寸使其非常適合輔助資料處理的小型系統，例如5G蜂巢式網路。

本文中提及的三款FPGA包含數量大致相同的邏輯單元，但CertusPro-NX由於支援LPDDR4而具有顯著優勢。此外，其還具有更大的內部記憶體和SERDES頻寬，不僅可處理和傳輸更多資料，而且還可以將功耗降低多達75%，電路板面積減少84%，在前一代產品創新技術的基礎上，擴展了記憶體、SERDES和邏輯功能。

(本文由萊迪思提供，作者為The Linley Group資深分析師)