AMD推出Radeon Instinct加速器,全速航向直覺化運算的新時代,不久將向夥伴廠商出貨,強化各種深度學習與異質化高效能運算(HPC)解決方案。
|
AMD推出Radeon Instinct加速器,全速航向直覺化運算的新時代,不久將向夥伴廠商出貨,強化各種深度學習與異質化高效能運算(HPC)解決方案。 |
在2016年12月首次對外亮相,全新GPU伺服器加速器系列包含Radeon Instinct MI25、Radeon Instinct MI8以及Radeon Instinct MI6,連同AMD的開源ROCm 1.6軟體平台,除了協助大幅提升效能與效率,更易於深度學習工作負載的執行,並同時加快深度學習的推論與訓練,加速推升機器智慧。
Radeon Instinct最初三款加速器設計旨在支援廣泛的機器智慧應用
*Radeon Instinct MI25加速器採用「Vega」架構,運用14奈米FinFET製程,將成為全球最極致的訓練加速器,支援各種超大規模機器智慧與深度學習資料中心應用。MI25能在被動式散熱的單GPU伺服器介面卡上提供卓越的FP16與FP32效能,透過本身64個運算單元(4,096個串流處理器)提供24.6 TFLOPS浮點運算的FP16或12.3 TFLOPS浮點運算的FP32尖峰效能。憑藉16GB的超高頻寬HBM2 ECC GPU記憶體以及高達484 GB/s的記憶體頻寬,Radeon Instinct MI25針對超大規模平行處理應用進行優化,讓機器智慧與HPC等級系統工作負載能處理龐大的資料集。
*Radeon Instinct MI8加速器運用高效能低功耗的「Fiji」GPU架構,這款微型HPC與推論加速器具備8.2 TFLOPS浮點運算的尖峰FP16/FP32效能,板卡的功耗不到175瓦,並搭載4GB的高頻寬記憶體(HBM),採用512位元記憶體介面。MI8適用於機器學習推論以及各種HPC應用領域。
*Radeon Instinct MI6加速器基於「Polaris」GPU架構,這款採用被動式散熱設計的推論加速器具備5.7 TFLOPS浮點運算的尖峰FP16/FP32效能,尖峰功耗僅150瓦,並以256位元記憶體介面搭載16 GB的超高速GDDR5 GPU記憶體。MI6是一款多用途加速器,適合用在HPC與機器學習推論,以及邊緣訓練等應用領域。
AMD開源解決方案為Radeon Instinct硬體挹注動能
*ROCm 1.6軟體平台預計於6月29日發布,不僅效能提升且支援MIOpen 1.0函式庫,兼具可擴充以及完全開源的特性,為新類別混合式超大規模與HPC等級系統工作負載提供高彈性且性能強大的異質化運算解決方案。ROCm內含開源的Linux驅動程式,針對可擴充多重GPU運算進行優化,ROCm軟體平台能提供多種規劃模型、HIP CUDA轉換工具,以及透過異質運算編譯器(HCC)支援GPU加速。
*開源MIOpen GPU加速函式庫現已和ROCm平台一起釋出,並支援各種機器智慧框架,包含Caffe、TensorFlow以及Torch。
AMD預計在2017年第3季開始向技術夥伴供應Radeon Instinct產品,讓他們開發各種深度學習與HPC解決方案,其中包括Boxx、Colfax、Exxact公司、技嘉、英業達以及美超微等廠商。