CEVA公司推出即时神经网路软体架构CEVA 深层神经网路(CEVA Deep Neural Network, CDNN),以简化低功率嵌入式系统中的机器学习部署。 CDNN充分利用CEVA-XM4 成像和视觉DSP的处理能力,使得嵌入式系统执行深层学习任务的速度比建基于GPU的系统提高三倍,同时消耗的功率减少三十倍,且所需的记忆体频宽也减少十五倍。例如,在28nm下对每秒30帧的1080p串流视讯运行建基于深层神经网路(DNN)的行人检测演算法时,所需功率不到30mW。
|
CDNN充分利用CEVA-XM4 成像和视觉DSP的处理能力,使得嵌入式系统执行深层学习任务的速度比建基于GPU的系统提高三倍... |
CDNN具备高性能、低功率和低记忆体频宽的关键是CEVA网路产生器(CEVA Network Generator),这项专有的自动化技术能够将客户的网路结构和权重转换为在即时情况下使用的纤细客制化网路模型,以实现可以显著减少功耗和记忆体频宽、且速度更快的网路模型,与原本的网路相比,其精度衰退的程度不到1%。一旦产生了这个客制化嵌入就绪的网路,便可使用完全最佳化的卷积神经网路(Convolutional Neural Network, CNN)层、软体库和API在CEVA-XM4图像和视觉DSP上运行。
CEVA公司CEVAnet合作伙伴计画的成员之一Phi Algorithm Solutions已经利用CDNN,为CEVA-XM4 DSP实施了一个建基于CNN的通用目标检测(Universal Object Detector)演算法。现在应用开发人员和OEM厂商可以把这个演算法用于各种应用,包括用于安全需求的行人检测和面部检测、先进驾驶辅助系统(ADAS)和建基于低功耗相机功能系统的其它嵌入式设备。
Phi Algorithm Solutions总裁兼共同创办人Steven Hanna表示:「CEVA深层神经网路架构为我们建基于卷积神经网路的演算法提供了一条从离线训练到即时检测的快速而流畅之途径,使得我们能够在短短几天之内获得经过最佳化的独特目标检测网路实施方案,且功耗明显比其它平台低许多。CEVA-XM4图像和视觉DSP结合CDNN架构,是嵌入式视觉设备的理想选择,并且为使用深层学习技术的人工智慧设备在未来数年的发展奠下了稳定基础。」
CEVA行销副总裁Eran Briman表示:「到目前为止,我们已赢得了二十多项设计,让我们得以在嵌入式视觉处理器领域持续保持优势,而我们也不断地强化视觉IP产品的组合,从而协助客户以更短的时间将产品推出,以及把风险减至最低。我们用于CEVA-XM4的新型深层神经网路架构是嵌入技术产业中第一款同类产品,为寻求在功率受限的嵌入式系统中实施可行深层学习演算法的开发人员向前迈出一大步。」
CDNN软体架构将以原始程式码的形式提供,扩展了CEVA-XM现有的应用开发人员套件(ADK)。它灵活性高并采用模组化设计,能够支援完整的CNN实施方案或特定层,并且可与各种网路和结构共用,比如使用Caffe、Torch或Theano训练架构开发的网路,或专有网路。 CDNN包括用于图像分类、定位和目标识别的即时范例模型,可用于目标和场景识别、先进驾驶辅助系统(ADAS)、人工智慧(AI)、视频分析、扩增实境(AR)、虚拟实境(VR)和类似的电脑视觉应用。CEVA公司将在11月12日举办一场针对实施嵌入式系统机器视觉应用的即时网路研讨会,其中将包括对CDNN的深入探讨。 (编辑部陈复霞整理)