Altera公司宣布微软采用Altera Arria 10 FPGA(现场可程序化门阵列)实现采用CNN(卷积神经网络)算法的数据中心加速功能,其每瓦性能优异。这些算法通常用于影像分类、影像识别,以及自然语言处理等。
|
/news/2015/03/02/1439392280S.jpg |
微软研究人员在云端技术上不断取得进展,采用Arria 10开发工具包和Arria 10 FPGA工程样品,展示了每瓦40 GFLOPS的性能。而且,与GPGPU相比,在CNN平台上,这一个FPGA的性能功率消耗比是CNN的3倍。能够达到此性能水平,是由于采用了开放软件开发语言OpenCL与VHDL,对Arria 10 FPGA及其IEEE754硬式核心浮点DSP(数字讯号处理)模块进行程序设计。
微软研究院客户和云端应用总监Doug Burger评论表示:「我们发现采用了Arria 10工程样品之后,CNN性能和功率效益大幅度提升,硅芯片中DSP模块的高精度硬式核心浮点功能是我们取得令人注目的研究成果的主要原因。」
Altera运算和储存业务部总监Michael Strickland表示:「FPGA在神经算法上有架构方面的优势,能够高效率的进行卷积和汇集,其灵活的数据通路支持大量的OpenCL核心直接互相传送数据,而不需要使用外部内存。Arria 10在架构上还有更多的优势,乘法和加法都支持硬式核心浮点—这种硬式核心浮点功能在逻辑数量和时钟速度上要优于传统的FPGA产品。」
Altera曾宣布微软使用其Stratix V FPGA在创新的Catapult电路板上加速进行搜寻,这类电路板于去年年底部署在第一个Bing数据中心的服务器中。