平行演算法隨著電腦運算廣度的需求日增而越來越重要,特別是在高階科學計算、高畫質影像處理、醫學顯影與基因分析、地質探測、以及工業用圖形設計領域,高速運算處理的需求越來越高。資料平行運算(data-parallel computing)模式該如何創新整合,順應未來多核心圖形運算以及大量資料計算處理的繁雜架構,符合節能簡碳並有效運用空間,已成為重要課題。
|
圖為NVIDIA Telsa與GPU運算部門總經理Andy Keane。(Source:HDC) |
NVIDIA Telsa與GPU運算部門總經理Andy Keane表示,對於高速資料運算,一般x86叢集平行運算架構採用多核心CPU模式,IBM也有多核處理器運作平行計算。超過90%的使用者或許熟悉傳統x86叢集系統在高性能運算(High Performance Computing;HPC)領域的使用模式,不過多核心運算模式已經衍生繁複的資料處理叢集伺服器架構,高耗能負擔也成為高效能資料處理中心亟待解決的課題。現今美國高速運算中心所耗費電力已經佔整體美國使用電力的7%,其中3.5%是運用在散熱方面,提升百倍運算意味著CPU預算的暴增,更不符經濟效益。
Andy Keane指出,以工作站或資料中心高速運算應用為主的繪圖處理器GPU平台,在平行運算效能專精度和叢集電腦網路多重應用上,往往比x86架構更具優勢。NVIDIA的GPU平行運算架構,電晶體密度高、多核擴充性強、具備高效能平行運算處理能力,且可帶動影像解析軟體發展,更為廣泛的經濟效益正在浮現。
Andy Keane深入分享表示,可擴充的GPU平行運算架構,能夠運作異質(heterogeneous)序列化平行運算,同時可使用C語言編程,進一步提升運算效能。此外NVIDIA針對GPU所設計的平行編程環境CUDA,可用於Windows及Linux,能讓應用程式在GPU上順暢運行。Andy Keane強調,CPU有60%的效能處理暫存記憶體,同時處理許多作業讓CPU運算效能降低,GPU架構可迅速處理單一深度問題,可專門滿足高速運算處理中心對於百倍以上的處理效能需求。GPU運算架構整合並行核心GPU和多核CPU,速度亦可大幅超越多核心系統,也能符合節能運作模式,4核心朝向240顆核心的高速運算架構也不是夢想,落實個人超級電腦(super-computing)以及高速運算工作站的條件也越來越成熟。
Andy Keane進一步表示, NVIDIA結合CUDA平行編程的GPU晶片,目前已出貨超過一億顆,其中運用在高速運算的Tesla晶片系列,在醫學顯影、分子動力學、視訊轉碼、天體物理、金融財務、3D超音波、量子化學、基因排序、地質能源探勘等應用領域,分別達到17~149倍不等的運算性能。針對HPC的平行運算Telsa 10晶片,電晶體數達14億顆,具有240個處理核心,浮點運算次數可達每秒10億次,加上4GB的記憶體容量,處理效能為Tesla 8的一倍以上,可滿足工作站、資料處理中心以及伺服器中心在百倍高速運算處理的需求。
Andy Keane談及GPU應用時表示,NVIDIA正積極深化GPU平行運算架構在台灣繪圖分析和資料處理的市場影響力,將協助開拓台灣高階物理分子動力學、建築地質偵測以及氣候模擬等高速運算應用領域,並與台灣國家高速網路與計算中心(NCHC),強化固網中心高速電腦運算能力。NVIDIA同時密切與台大交大等校學術院校合作,進一步全面擴大台灣使用GPU平台架構的生態體系。