账号:
密码:
最新动态
产业快讯
CTIMES/SmartAuto / 產品 /
NXP推出基於MCU的Glow神经网路编译器 实现边缘机器学习
 

【CTIMES/SmartAuto 报导】   2020年08月06日 星期四

浏览人次:【3420】

恩智浦半导体(NXP Semiconductors N.V.)发表eIQ机器学习(ML)软体对Glow神经网路(Neural Network;NN)编译器的支援功能,针对恩智浦的i.MX RT跨界微控制器,实现占用较低记忆体并更高效能的神经网路编译器应用。

Glow编译器由Facebook开发,能整合特定目标的最隹化,恩智浦利用这种能力,使用适用於Arm Cortex-M核心和Cadence Tensilica HiFi 4 DSP的神经网路运算元库(NN operator libraries),最大化提升i.MX RT685以及i.MX RT1050和RT1060的推论效能。此外,此功能已整合至恩智浦的eIQ机器学习软体开发环境中,於恩智浦的MCUXpresso软体开发套件(Software Development Kit;SDK)中免费提供。

2018年5月,率先开发PyTorch的Facebook导入Glow(Graph Lowering神经网路编译器),作为开源社区(open source community)专案,其目的是藉由最隹化提高一系列硬体平台上的神经网路效能。

作为神经网路编译器,Glow能在尚未最隹化的神经网路的基础上,生成高度最隹化的代码。这就有别於典型的神经网路模型处理(neural network model processing),後者采用即时编译,因此需要更高的效能,并增加记忆体消耗。然而,像Glow这样直接运作最隹化的代码可显着降低处理与记忆体要求。此外,恩智浦也在Glow开源社区中扮演着积极角色,帮助推广和普及Glow的新功能。

Facebook软体工程经理Dwarak Rajagopal表示:「GitHub中提供的标准版Glow可直接在任何装置上运行,让使用者能够灵活地针对Arm Cortex-A和Cortex-M核心以及RISC-V架构等其感兴趣的基础架构编译神经网路模型核心。恩智浦藉由充分运用微控制器运算元件的专用软体库,并将效能提升2至3倍,展示了从以云端为基础的高阶机器到低成本的嵌入式平台的广泛范围内,将Glow神经网路编译器用於机器学习应用的诸多优势。」

未来几年内,机器学习应用的需求预期将大幅增加。据TIRIAS Research预测,2025年,98%的边缘装置将使用某种形式的机器学习/人工智慧。而市场预测,届时即使没有专用的机器学习加速器(machine learning accelerator),也将有180亿至250亿部装置具有机器学习功能。消费型装置制造商和嵌入式物联网开发人员将需要将机器学习框架最隹化,进而实现使用微控制器的低功耗边缘嵌入式应用。

恩智浦半导体资深??总裁暨边缘处理业务总经理Ron Martino表示:「藉由eIQ机器学习软体框架,运用高度整合的i.MX应用处理器和高效能i.MX RT跨界微控制器的强大功能,恩智浦正在推动机器学习功能在边缘装置上的实现。随着i.MX RT系列跨界微控制器增加对Glow的支援,我们的客户能够编译深度神经网路模型,为他们的应用带来竞争优势。」

恩智浦针对机器学习的边缘智慧环境解决方案是一个全面的工具包(toolkit),提供开发人员需要的建构模组,帮助他们高效地在边缘装置中实现机器学习。Glow整合到eIQ软体後,机器学习开发人员将拥有全面的高效能框架,可在包含i.MX RT跨界微控制器和i.MX 8应用处理器在内的恩智浦边缘处理解决方案上进行扩展。客户拥有更强大的工具,能够在i.MX RT微控制器和i.MX应用处理器上开发机器学习语音应用、物体辨识、脸部辨识等应用。

eIQ现在具有针对Glow和TensorFlow Lite的推论支援,对此,恩智浦会定期执行基准测试以衡量其效能。微控制器基准测试包含标准神经网路模型,例如CIFAR-10。以CIFAR-10模型为例,恩智浦采集的基准测试资料展现了如何运用i.MX RT1060装置(采用600MHz Arm Cortex-M7)、i.MX RT1170装置(采用1GHz Arm Cortex-M7)和i.MX RT685装置(采用600 MHz Cadence Tensilica HiFi 4 DSP)的效能优势。

恩智浦对Glow的支援与Cadence为Tensilica HiFi 4 DSP提供的神经网路库(Neural Network Library;NNLib)紧密相结合,该DSP提供4.8GMAC效能。同样以CIFAR-10为例,恩智浦的Glow藉由使用此DSP来加快神经网路运算,实现25倍的效能提升。

Cadence Tensilica IP企业??总裁Sanjive Agarwala表示:「Tensilica HiFi 4 DSP最初整合在i.MX RT600跨界微控制器中,目的是提高各种不同的音讯和语音处理应用的速度。然而,当越来越多机器学习推理应用瞄准低成本、低功耗的微控制器级应用时,HiFi 4 DSP凭藉固有的DSP运算效能,成为加快这些神经网路模型的理想选择。随着恩智浦在eIQ机器学习软体中采用Glow,i.MX RT600微控制器的客户能够利用该DSP来满足多种机器学习应用的需求,包含关键字检索(keyword spotting;KWS)、语音辨识、降噪和异常检测。」

Arm公司机器学习行销??总裁Dennis Laudick表示:「恩智浦将Arm CMSIS-NN软体库涵盖在elQ中,目的是尽可能地提升效能,减少Arm Cortex-M核心上的神经网路记忆体占用。以CIFAR-10神经网路模型为例,恩智浦能够利用CMSIS-NN实现1.8倍的效能提升。其他神经网路模型应该亦能够产生相似的结果,这清楚地展示了此款高阶编译器与我们的最隹化神经网路运算元库(NN operator library)的优势。」

恩智浦的整合Glow神经网路编译器的eIQ软体现已上市,并透过i.MX RT600跨界微控制器、i.MX RT1050和i.MX RT1060跨界微控制器的MCUXpresso 软体开发套件提供。未来将会推出适用於恩智浦其他微控制器的整合Glow神经网路编译器的eIQ软体。

關鍵字: 神经网路  编译程序  边缘运算  NXP 
相关产品
恩智浦全新i.MX RT700跨界MCU搭载eIQ Neutron NPU打造AI边缘
恩智浦整合超宽频安全测距与短距雷达推动自动化IIoT应用
恩智浦新一代JCOP Pay提供支付卡客制化服务
康隹特新款SMARC模组搭载恩智浦i. MX 95系列处理器
恩智浦SAF9xxx音讯DSP提升AI音讯处理功能
  相关新闻
» 史丹佛教育科技峰会聚焦AI时代的学习体验
» 土耳其推出首台自制量子电脑 迈入量子运算国家行列
» COP29聚焦早期预警系统 数位科技成关键
» MIPS:RISC-V架构具备开放性与灵活性 满足汽车ADAS运算高度需求
» 应材於新加坡举行节能运算高峰会 推广先进封装创新合作模式
  相关文章
» 以模拟工具提高氢生产燃料电池使用率
» 掌握石墨回收与替代 化解电池断链危机
» SiC MOSFET:意法半导体克服产业挑战的颠覆性技术
» 超越MEMS迎接真正挑战 意法半导体的边缘AI永续发展策略
» 光通讯成长态势明确 讯号完整性一测定江山

刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK8BP8TV15GSTACUKE
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw