CEVA发布了用於边缘深度学习推理而且功能强大的专用人工智慧(AI)处理器系列NeuPro。NeuPro系列处理器专为智慧和互连的边缘设备供应商而设计,寻求以简化的方式来快速掌握深度神经网路技术所提供的重要可能性。
|
CEVA推出NeuPro(TM) 用於边缘深度学习的AI处理器系列 |
NeuPro系列建立在CEVA 於电脑视觉应用深层神经网路领域的行业领先地位和丰富经验上。数十家客户已经将CEVA-XM4和CEVA-XM6视觉平台与CDNN神经网路软体框架一起部署在消费性、监控和先进驾驶辅助系统(ADAS)产品中。这个全新的专用AI处理器系列提供了相当出众的性能提升,范围从入门级处理器的每秒2 万亿次运算(2 TOPS)到最高级配置的12.5 TOPS。
NeuPro处理器产品线将AI的应用扩展到机器视觉以外的新型边缘应用,包括自然语言处理、即时翻译、认证、工作流程管理以及许多以学习为基础的其他应用,使设备变得更加智慧并减少人手操作。
CEVA视觉业务部门??总裁兼总经理Ilan Yona评论表示:「AI应用程式趋向於边缘处理,而不是依靠云端服务,这点非常清楚。其中所需要的运算能力以及边缘处理的低功率限制,要求使用专用处理器,而不是使用CPU、GPU或DSP。我们设计了NeuPro处理器,以降低进入AI领域时存在於架构和软体方面的高门槛。我们的客户现在拥有经过最隹化和具高成本效益的标准AI平台,可用於众多以AI为基础的工作负载和应用。」
NeuPro体系结构由建基於硬体和软体的引擎结合组成,以实现完整的可调节及可扩充的AI解决方案。针对每个应用程式层精确地配合各个硬体、软体及可配置的性能选项,从而实现对功耗、性能和占位面积(PPA)的最隹化。
NeuPro系列包括四款AI处理器,提供不同级别的并行处理性能,NP500是最小的处理器,包含512个MAC单元,瞄准物联网、穿戴式设备和相机应,NP1000包含1024个MAC单元,锁定中档智慧手机、ADAS、工业应用和AR/VR头戴设备,NP2000包含2048个MAC单元,瞄准高阶智慧手机、监控、机器人和无人机应用,NP4000包含4096个MAC单元,用於企业监控和自动驾驶的高性能边缘处理。
每款处理器均由NeuPro引擎和NeuPro VPU组成。NeuPro引擎包括神经网路层的硬连线实现,其中包括卷积、完全连接、池化和启动。NeuPro VPU是一款高成本效益的可编程设计向量DSP,用於处理CDNN软体,并为AI工作负载的新进展提供以软体为基础的支援。NeuPro支援8位元和16位元神经网路,即时做出最隹决策,以实现精度和性能之间的最隹平衡。MAC单元在运行时的利用率达到百分之九十以上,确保最隹化的神经网路性能。整体处理器设计大大降低了DDR频宽,从而提升了任何AI应用的功耗水准。
NeuPro系列与CEVA屡获殊荣的神经网路软体框架CDNN相结合,为开发人员提供了终极的深度学习解决方案,能够简单高效地产生专有的神经网路并移植到处理器。CDNN支援全部的层类型和网路拓扑,从而实现最快的上市时间。
配合NeuPro处理器产品线,CEVA还将提供NeuPro硬体引擎作为卷积神经网路(CNN)加速器。当与CEVA-XM4或CEVA-XM6视觉平台相结合时,CNN为寻求以单一统一平台来处理成像、电脑视觉和神经网路工作负载的客户提供灵活的选择。