因应机器智慧应用 AMD推出Radeon Instinct加速器
|
因应机器智慧应用 AMD推出Radeon Instinct加速器 |
AMD推出Radeon Instinct加速器,全速航向直觉化运算的新时代,不久将向伙伴厂商出货,强化各种深度学习与异质化高效能运算(HPC)解决方案。
在2016年12月首次对外亮相,全新GPU伺服器加速器系列包含Radeon Instinct MI25、Radeon Instinct MI8以及Radeon Instinct MI6,连同AMD的开源ROCm 1.6软体平台,除了协助大幅提升效能与效率,更易于深度学习工作负载的执行,并同时加快深度学习的推论与训练,加速推升机器智慧。
*Radeon Instinct MI25加速器采用「Vega」架构,运用14奈米FinFET制程,将成为全球最极致的训练加速器,支援各种超大规模机器智慧与深度学习资料中心应用。 MI25能在被动式散热的单GPU伺服器介面卡上提供卓越的FP16与FP32效能,透过本身64个运算单元(4,096个串流处理器)提供24.6 TFLOPS浮点运算的FP16或12.3 TFLOPS浮点运算的FP32尖峰效能。*Radeon Instinct MI25加速器采用「Vega」架构,运用14奈米FinFET制程,将成为全球最极致的训练加速器,支援各种超大规模机器智慧与深度学习资料中心应用。 MI25能在被动式散热的单GPU伺服器介面卡上提供卓越的FP16与FP32效能,透过本身64个运算单元(4,096个串流处理器)提供24.6 TFLOPS浮点运算的FP16或12.3 TFLOPS浮点运算的FP32尖峰效能。
凭借16GB的超高频宽HBM2 ECC GPU记忆体以及高达484 GB/s的记忆体频宽,Radeon Instinct MI25针对超大规模平行处理应用进行优化,让机器智慧与HPC等级系统工作负载能处理庞大的资料集。
*Radeon Instinct MI8加速器运用高效能低功耗的「Fiji」GPU架构,这款微型HPC与推论加速器具备8.2 TFLOPS浮点运算的尖峰FP16/FP32效能,板卡的功耗不到175瓦,并搭载4GB的高频宽记忆体(HBM),采用512位元记忆体介面。 MI8适用于机器学习推论以及各种HPC应用领域。
*Radeon Instinct MI6加速器基于「Polaris」GPU架构,这款采用被动式散热设计的推论加速器具备5.7 TFLOPS浮点运算的尖峰FP16/FP32效能,尖峰功耗仅150瓦,并以256位元记忆体介面搭载16 GB的超高速GDDR5 GPU记忆体。 MI6是一款多用途加速器,适合用在HPC与机器学习推论,以及边缘训练等应用领域。
AMD开源解决方案为Radeon Instinct硬体挹注动能
*ROCm 1.6软体平台预计于6月29日发布,不仅效能提升且支援MIOpen 1.0函式库,兼具可扩充以及完全开源的特性,为新类别混合式超大规模与HPC等级系统工作负载提供高弹性且性能强大的异质化运算解决方案。 ROCm内含开源的Linux驱动程式,针对可扩充多重GPU运算进行优化,ROCm软体平台能提供多种规划模型、HIP CUDA转换工具,以及透过异质运算编译器(HCC)支援GPU加速。
*ROCm 1.6软体平台预计于6月29日发布,不仅效能提升且支援MIOpen 1.0函式库,兼具可扩充以及完全开源的特性,为新类别混合式超大规模与HPC等级系统工作负载提供高弹性且性能强大的异质化运算解决方案。 ROCm内含开源的Linux驱动程式,针对可扩充多重GPU运算进行优化,ROCm软体平台能提供多种规划模型、HIP CUDA转换工具,以及透过异质运算编译器(HCC)支援GPU加速。