隨著人工智慧及大數據崛起,資料中心日益龐大,儲存容量也因疫後數位轉型加速而大幅成長。另一方面,智慧型網路卡與資料處理器所代表的新興加速運算裝置預料也將帶動伺服器硬體加速成長,掀起資料中心運算架構變革潮。CPU核心數增加以優化記憶體應用、提升高效運算能力成為重要課題。
CPU發展史堪稱Intel和AMD「雙雄爭霸」的發展史,可分為4位微處理器、8位微處理器、16位微處理器、32位微處理器及六64位微處理器等。Intel於1971年推出世上第一款微處理器4004,是包含2300個晶體管的4位CPU。
17年前,第一顆雙核心X86處理器問世,AMD推出首款Opteron雙核處理器,Intel也推出雙核處理器,開啟CPU多核處理器(Multi-Core Processor)時代。在多核處理器的競技上,Intel多半保持領先,但約6年前AMD重返伺服器市場,搶先對手推出32核心伺服器處理器EPYC,刷新Intel的24核心紀錄。迄今,雙雄爭霸互有勝出。
過去,單顆CPU核心數不夠多,處理能力相對較弱,只能以增加CPU顆數的方式搭配高效能應用伺服器,組成更多CPU核心的運算叢集以提高伺服器處理效能。當CPU核心數達64核心,代表一台64核單路伺服器就能協助企業執行各種複雜運算或高密集運算工作。
X86處理器在隨後的發展中逐步推展大量平行運算或浮點運算可視化、AI、深度學習等應用,之後,圖形處理器(GPU)出現,智慧型網路卡(SmartNIC)與資料處理器(DPU)等新興加速運算裝置陸續分食X86處理器的運算工作,催化新一波伺服器硬體加速變革。
另一方面,為迎合DPU市場需求,業者必須快速提升伺服器的處理能力,增加伺服器CPU核心是最簡單也最容易的方式。
此外,AI與特定運算的需求越來越大,加上物聯網網路傳輸資料的安全性需求增高,處理器架構也必須全面翻新才能因應市場需求。市場上的CPU分為兩大陣營,一是以Intel、AMD為首的複雜指令集CPU,二是以IBM、ARM為首的精簡指令集CPU,除了品牌相異,產品架構也不盡相同,Intel、AMD CPU為X86架構,IBM CPU為PowerPC架構,ARM則是ARM架構。
新一代異質運算架構提升運算效能
由於AI加速晶片和資料處理晶片(DPU)加入運算陣容,新一代異質運算架構逐步成形。因應全球資料中心高效能運算、雲端與AI運算需求,帶動運算力更強大、更高效的伺服器需求。Intel稱霸半導體界十餘載,如今,X86中央處理器統治資料中心運算架構的局面已然鬆動。
圖一 : Arm推出新 Armv9 架構 CPU。(source:Arm) |
|
AI時代處理深度學習需要運用複雜運算,「效能」與「能耗」成為企業亟需解決的兩大問題,因此衍生出GPU、FPGA及ASIC 等異質運算架構。異質運算是指系統使用不同的計算單元,如CPU、GPU、DPU、VPU、FPGA、ASIC等,不同運算工作需要交由符合需求的專用處理器執行才能大幅提升運算效能或改善能源使用效率。
近年來,異質運算的定義越來越多元,也包含使用不同架構的處理器及使用不同處理器架構的伺服器解決方案,主要目的是在最短時間內快速解決特殊工作負載,比方Arm架構處理器不只具有運算核心數量較多、功耗較低等優勢,也更容易與Arm架構行動裝置互通有無,順暢溝通。
採用不同處理器架構相當於進階版的異質運算,除了X86架構,還有Arm架構處理器等替代方案可以搭配各類新運算產品。隨著晶圓代工商業模式成主流,AMD與蘋果(Apple)似已威脅到Intel的霸主地位,過去2年,幾大龍頭業者也陸續推出新的CPU產品及異質運算架構解決方案。
商機可期 龍頭業者動作頻頻
從數據面觀察,不難看出資料中心運算架構商機可期,幾大龍頭業者也為加速搶灘而動作頻頻。IDC《全球邊緣運算支出報告》指出,2022年全球邊緣運算支出預計達1760億美元,較2021年成長14.8%,至於企業和服務供應商在邊緣解決方案的軟硬體及服務支出預計在2025年達到2740億美元的水準。由於邊緣部署具有多樣化需求,為技術供應商創造極大商機,預料市場將出現更多新的解決方案。
以企業端來說,2022年邊緣投資大宗包含製造營運、生產資產管理、智慧電網、全通路營運、公共安全與緊急應變、貨運監控和智慧交通系統。預估2020-2025年,公共基礎設施維護、網路維護、解剖診斷和AR 輔助手術等領域支出成長較快。IDC進一步指出,美國將成邊緣解決方案的最大投資者,預計2022年支出達765億美元,西歐和中國則是第二大地區,支出總額分別為306億美元和208億美元。
DIGITIMES Research則預期,2022年下半年IC短缺可望緩解,由於北美雲端業者、大型資料中心(如字節跳動、BAT)對伺服器需求強勁,加上Intel、AMD新一代CPU 2021下半年起小量出貨帶動換機潮,全球伺服器出貨量呈現強勁成長力道。
幾大龍頭廠近2-3年動作頻頻,較勁意味濃厚。Arm於2021年發表全新Armv9架構的全面運算解決方案,帶來次世代沉浸式與互動式體驗,提供更高的運算效能、安全性與擴充性。Arm推出 Cortex-X2、Cortex-A710及Cortex-A510三款CPU產品,提升筆電效能及智慧電視用戶體驗,也為手遊提供高效率的電池續航力。
圖二 : 英特爾首度在PC X86架構處理器上推出具有大小核心的異質架構處理器。(source:Intel) |
|
Arm資深副總裁暨終端產品事業群總經理Paul Williamson 表示,Cortex-X2 是第一顆Armv9旗艦CPU,與Cortex-X1相較,效能提升16%,機器學習效能則提升二倍,預計帶來逾30%的峰值效能,可以同步滿足高階智慧手機、筆電需求;Cortex-A710則是第一顆基於Armv9 的大核CPU,與Cortex-A78相比,能源效率提升30%、效能提高10%;Cortex-A510是首次推出的高效率小核核心,效能增加35%,機器學習效能更提升逾三倍,適合運用於智慧手機、家用及穿戴裝置。
Arm也推出四款GPU新品:Mali-G710、Mali-G610、Mali-G510及Mali-G310。與Mali-G78相較,Mali-G710的效能提升20%、機器學習效能提高35%、能源效率提高20%,主攻高階智慧手機與Chromebook市場;Mali-G610承襲Mali-G710功能但價格更親民;Mali-G510不僅效能提升,耗電量也節省22%,鎖定中階智慧手機、高階智慧電視與機上盒市場;Mali-G310則是將Valhall架構與高品質繪圖技術導入成本較低的入門智慧手機、擴增實境裝置與穿戴裝置。
2021年底,Intel發表Alder Lake第12代Intel Core桌上型6款處理器,在伺服器虛擬化及軟體定義化架構下陸續加入X86指令集,讓X86處理器可以承擔資料中心多數的運算負載。這款首度使用Intel 7奈米製程的混合架構CPU產品命名第12代Intel Core i9-12900K,堪稱「地表最強遊戲處理器」,16核心包含效能核心(P-core)及效率核心(E-core),也是X86架構個人電腦處理器首度使用大小核心設計。市場評估,Intel此舉將掀起新一輪競賽,尤其大小核心的混合架構設計,直接挑戰2020年蘋果發表的自研晶片M1,向其他龍頭大廠示威的意圖也很明顯。
迎戰雙A(AMD與APPLE) Intel強勢回歸
在此不得不提CPU兩大陣營外的第三方新勢力:蘋果(Apple),以及蘋果掀起的異質核心(大小核心)概念。蘋果於2020年發表採用Arm架構設計的自研晶片M1後,異質核心(大小核心)概念引起全球關注。M1系列處理器具有兩大特點,一是異質核心概念讓電腦可以視工作吃重度不同,將適合的工作內容分派給大核心或小核心處理,這般「適才適性」的處理方式大大降低機器耗能,提高運算最佳化效能;二是統一記憶體架構,透過M1 MAX,CPU跟GPU(顯示晶片)可以同步共享64GB記憶體,達資料存取頻寬最大化效能。
圖三 : 全系列新款AMD Ryzen 6000系列處理器。(Source:AMD) |
|
緊跟在Intel之後,AMD在2022年初發表全系列新款AMD Ryzen? 6000系列處理器,全新Zen 3+核心架構內建全新AMD RDNA? 2架構的顯示核心。AMD Ryzen 6000系列處理器採用台積電6奈米製程技術,帶來1080p 3A級遊戲體驗以及超長的電池續航力。此外,AMD也發表新款Ryzen 7 5800X3D桌上型處理器,採用AMD 3D V-Cache技術,並率先採用Zen 4架構與全新AMD Socket AM5插槽的新款Ryzen 7000系列CPU。Ryzen 6000系列處理器的時脈速度高達5 GHz,堪稱目前速度最快的AMD Ryzen處理器,與Ryzen 5000系列相比,處理速度提高1.3倍,顯示效能提高2.1倍。
AMD在GPU和CPU運算核心部分都能提出效能更好的架構,如Zen和RDNA架構。繪圖處理器GPU可以負責處理電腦顯示繪圖相關項目,Zen架構可協助電腦在執行網頁瀏覽、多工作業及串流視訊應用時更快速處理顯示速度,RDNA架構有助CPU更快速處理數據運算與執行指令。
輝達(NVIDIA)則在2021年推出首款基於Arm架構打造的NVIDIA Grace CPU,針對AI及高效能運算工作負載所設計,也是目前唯一支援NVLlink傳輸介面的CPU,可以和GPU搭配運作。NVIDIA創辦人暨執行長黃仁勳表示,要將Arm架構晶片拓展至雲端運算、超級運算、個人電腦及自動化系統等領域,資料中心產品線將由CPU、GPU、DPU等三種晶片組成,NVIDIA架構平台將同時支援X86跟Arm。
預計2023年初上市的NVIDIA Grace CPU運算效能優於目前效能最快的超級伺服器約10倍的速度,可滿足自然語言運算、推薦系統及AI超級運算等先進運算需求,同時可以整合Arm CPU 核心架構和低功率記憶體次系統,兼具高效與節能優勢。
CPU雙雄爭霸 2022年更精彩
雖然幾大龍頭業者競爭態勢明顯,但各自著眼的產品發展策略不同,比方AMD走小晶片(Chiplets)路線,蘋果選擇M1 Max單一晶片,前者走小眾化路線,後者強調「數大便是美」,在432平方公釐面積的M1晶片內佈建高達570億電晶體,功耗僅約90W。
數據顯示,M1 Max GPU足以匹媲美AMD與Nvidia的高階GPU。在Intel發表異質核心X86處理器後,X86架構往前推進一大步,未來CPU效能還有拓展空間,至於AMD等強敵未來是否跟進異質架構,對於市場及相關技術發展帶來何種變數,值得觀察。