回顧處理器的發展史,從過去一路走到今天,從單核心走到多核心,核心工作頻率越來越高,核心數與執行緒也不斷提升。尤其近年來,AI議題發酵,處理器不能只是單純多核心,還必須加入機器學習運算能力。而元宇宙應用讓處理器的負擔也大幅加重,僅靠著單一處理器完全無法滿足元宇宙相關的AR、VR、XR需求,加入繪圖處理器的運算能力勢在必行。另外,資料處理器(DPU)也在數據中心的運算處理中,扮演越來越重要的角色。
圖一 : 處理器不斷推陳出新,讓新的架構帶來更大的運算效能與優勢。 |
|
運算處理三要素
在今日的運算趨勢發展中,背後都需要透過三個最主要元素來達成,分別是CPU、GPU,以及DPU。CPU大家都非常熟悉了,這是在一般電腦裡面普遍都可見到的通用運算處理器。至於GPU,則是一種加速運算處理器,則在最近幾年,逐漸成為許多運算的核心處理器,特別是用在功能強大的即時影像處理。而由於其平行處理能力特別強大,也成為各種加速運算任務的最佳選擇,比如近年來常常看到的AI人工智慧、深度學習、大數據分析等應用,都是透過GPU來給予運算的能力。
我們發現過去十年中,運算也不只侷限於個人電腦與伺服器內,CPU與GPU正被廣泛用在各種大規模的資料處理中心裡。在號稱AI的世界裡,各種數據量其實非常驚人,如何做到更有效率的數據分配與處理,這就要交給DPU來進行處理。DPU是一種資料處理器,除了多核心架構外,也具備高效能網路介面,因此能夠很有效率地將數據傳輸到CPU與GPU來進行處理。NVIDIA執行長黃仁勳就說過,CPU、GPU,以及DPU將成為未來運算的三大支柱。CPU用於通用運算,GPU用於加速運算,DPU則用於進行資料處理等工作。
CPU的未來運算樣貌
AMD董事長暨執行長蘇姿丰表示,從雲端與PC到通訊與智慧終端,高效能和自行調適運算解決方案扮演著越來越重要的角色,塑造幾乎所有服務和產品的功能,並定義著未來運算的面貌。而AMD也完成對賽靈思的收購,不止具有轉型意義,也擴大了運算引擎的產品陣容優勢。高效能與自行調適產品市場擁有3000億美元規模,能在其中佔據更大的版圖,就更有機會成為市場贏家。
處理器大廠藉由不斷地推陳出新,讓新的處理器架構帶來更大的運算效能與優勢。AMD也擴展了多代的CPU核心、繪圖以及自行調適運算架構的藍圖,例如Zen 4運算核心將採用5奈米製程,而Zen 5運算核心則計劃於2024年推出,這些新一代的處理器除了在眾多領域的工作負載和功能中能提供更好的效能與效率,更納入了對AI與機器學習的優化。
AMD的第4代Infinity架構藉由高速互連技術,讓AMD IP可與第三方廠商的小晶片進行整合。另外值得注意的是,AMD XDNA是源自賽靈思的基礎架構IP,包含多項關鍵技術,其中包括FPGA架構與AI引擎(AIE)。FPGA架構結合FPGA邏輯與本地記憶體的自行調適互連,而AIE則提供針對高效能與節能AI以及訊號處理應用進行優化的資料流架構。AMD計劃從2023年所推出的AMD Ryzen處理器開始,未來在多個產品都將整合AMD XDNA IP。
新一代處理器的永續性
隨著全球進入Exascale時代,並加速邁向Zettascale,科技產品對於能源的耗用也越來越多。預計到2030年,資料中心將會消耗全球總發電量的3~7%,而運算基礎設施所需電力將占據新能源使用量的首位。事實上,處理器的發展,在追求更高運算效能的同時,近年來對於加速永續性、開放式的高效能運算創新也越來越重視。
英特爾副總裁暨超級運算事業部總經理Jeff McVeigh說,新一代的處理器不再只是追求無止盡的運算效能突破,而是在追隨永無止境運算需求的同時,還要創造一個可永續的未來,這是高效能運算(HPC)最大的挑戰之一。如果逐一解決HPC運算堆疊中的各個部分,包括晶片、軟體和系統,這將是一個可以達成的願景。
近年來,AI運算的崛起,讓處理器的發展趨勢走上一個全新的方向,並從晶片和異質運算架構邁開步伐。處理器大廠英特爾有項積極的HPC產品規劃,到了2024年將可提供多樣化的異質架構產品組合。這些架構讓英特爾能夠提升數個量級的效能表現,同時降低一般負載以及AI、加密和分析等新興工作負載的能耗需求。
近年來,英特爾不斷利用先進封裝技術和晶片創新,為HPC帶來實質性的效能、頻寬和省電等多方面改善。例如搭載高頻寬記憶體的Intel Xeon處理器,即是一個很好的例子,藉由封裝當中的高頻寬記憶體,以及整合進入CPU的加速器,能夠解放受限於記憶體頻寬的工作負載表現,同時在關鍵HPC使用案例中提供顯著的效能改善。
英特爾於提升HPC和AI超級運算工作負載數個量級效能的過程當中,運算密度是另外一個必要條件。例如英特爾推出首款旗艦型資料中心圖形處理器(GPU),已開始應用於複雜的金融服務和AI訓練與推論工作負載,提供更好的運算表現。事實上,運算的發展永無止盡。英特爾未來還將滿足更多新的運算需求,並將永續性列為全人類下一個超級運算時代的優先事項。
GPU打開AI新時代
在過去的兩年內,一億個新的視訊遊戲玩家加入了這個廣大的遊戲市場。一億這個數量聽起來非常驚人。除了更為吸睛的遊戲效果之外,另一個原因也不能被忽略,就是線上廣播以及TikTok等新興視訊應用市場,讓每個人都成為了創意藝術家。有了這麼多身為藝術內容創造者的人,所以創意市場確實比過去擴大了不少。
NVIDIA執行長黃仁勳指出,由於疫情影響,宅在家裡的遊戲玩家數量增加、個人內容創作者也在近年來大增,也有許多專業人士在家裡設立多媒體工作環境。除此之外,每個人在不同地方,都越來越需要有個工作用的電腦,例如在家裡有個家庭工作室,家庭辦公室的需求開始湧現。我們看到所有這些事情都正在發生。這些對於GPU也產生了相當大的需求。
NVIDIA執行長黃仁勳是NVIDIA的創立者,並透過GPU的運算能量,將世界帶往一個全新的AI時代。黃仁勳說,人們往往將NVIDIA視為一家晶片公司,只不過NVIDIA在很多層面上,都是一家高度整合的系統公司,它構建了完整的軟體堆疊、晶片、系統、系統軟體和AI演算法。而且不只是垂直整合,在進入市場後,也開放每個元件。
因此,如果客戶想使用NVIDIA的晶片,或者系統,甚至是系統軟體,NVIDIA都非常歡迎,甚至是最新的人工智慧演算法。因此,NVIDIA實際上在很多方面都非常不同,這是一家垂直整合的人工智能公司,並以開放的方式向生態系統提供產品。因此,客戶可以像從其他廠商那裡購買晶片一樣,購買NVIDIA的晶片。
近年來,NVIDIA的晶片之所以如此受到市場歡迎,是因為加速運算的世界與CPU截然不同。CPU的世界曾經因為這種名為X86架構的處理器發揮魔力而變得與眾不同。每個運行X86的軟體都在CPU上順利運行著。但是,X86處理器並無法應用於加速運算。因此,每一個加速運算系統、晶片或架構,就得依賴NVIDIA這樣的加速運算處理器。
黃仁勳說,在加速運算平台上運行的應用程序來之不易,為了滿足加速運算市場的需求,NVIDIA也非常努力地加速分子動力學、量子化學,並強化學習,包括RNN或CNN,或者Transformers或LSTMS等很多不同的演算。加速運算與X86架構非常不同。所以NVIDIA的方法是成為一家全棧(full stack)公司,為客戶帶來價值,但仍然允許平台開放,讓客戶可以按照他們喜歡的方式,整合這些加速運算晶片與技術。
Arm重新定義運算的未來
提到處理器,普遍存在於各種不同應用中的Arm架構處理器不可忽視。從營收成果顯示,各界對於Arm技術的需求非常強勁,而Arm生態系展現的實力也更勝以往。目前Arm的運算平台在雲端運算、車用與自主系統、物聯網、元宇宙等領域,都正在驅動下一波的科技革命。展望Arm技術所建構未來,Arm優先的任務是持續貫徹商業策略,並透過對產品路徑圖與工程人才的進一步投資,為合作夥伴提供所需的解決方案,並與生態系合作,重新定義運算的未來。
Arm架構處理器儘管偏重於行動運算市場,但其低功耗高效率的特性仍然深受市場關注。Arm終端產品事業部市場策略總監蔡武男指出,Arm未來的產品設計,將基於Armv9架構的特色,也就是效能、安全、可擴充且兼具功耗效率,並以完全運算方案為系統整體進行優化,為未來的市場所需,持續推出以使用場景為主(Use case-based)的、具有AI/ML及特定處理能力的高效能、低功耗的產品。這些產品也將滿足未來幾年,幾項值得注意的消費性終端產品的發展趨勢,包括電競手機、電競筆電、摺疊手機、以及元宇宙應用的AR/VR裝置等。
恩智浦半導體大中華區邊緣運算事業部產品行銷經理李宜儒也針對這個議題表示,Arm架構處理器之所以能夠在行動運算帶來突破,有幾項原因:一是低功耗。比起大型CPU,Arm處理器功耗在行動運算帶來很大的優勢。可攜式或穿戴式裝置需要低功耗來延長使用時間,這時展現Arm架構的優勢。也正因為這個優點,可以看到大多手機或可攜式、穿戴式裝置都選擇使用Arm架構處理器。第二個優點則是其拓展性。Arm的CPU類型相當多,這讓IC設計公司在選擇上多了彈性,可以針對某些應用選擇合適的內核,讓運算能力和成本都能夠得到控制。
結語
處理器市場必須由整個生態系的夥伴共同合作,包含製造、晶片、互連、軟體和系統,都需要同步投身其中。藉由這些共同努力,處理器相關廠商就有辦法將處理器的市場挑戰,包括AI運算、HPC等,從最大挑戰轉變成為最大的機會,並替未來世代改變這個世界。
**刊頭圖(source:intel.com)