開發AI晶片的主要考量需從很多層面著手。針對Arm架構如何加速AI的開發與部署,CTIMES零組件雜誌特別專訪了Arm應用工程總監徐達勇。對於AI晶片的開發設計,徐達勇表示,開發AI晶片的主要考量取決於不同的應用。舉例來說,對於雲端應用,最高效能是首要考慮因素,而在IoT裝置中,因為使用電池的限制,需要具備較低的功耗。他指出,基本上是從AI的Workloads考量,找到效能和功耗最適合的晶片。此外,還有兩個共通的基本要求:其一是AI晶片本身的效能與功耗是否符合效率要求,其二是開發硬體後是否能讓軟體工程師或演算法工程師方便快速地移植(porting)其機器學習的模型到硬體平台上。
|
Arm應用工程總監徐達勇 |
對於如何透過Arm架構快速開發與部署AI,徐達勇提出了幾個關鍵點。首先是Arm的開放性,Arm提供了開源的軟體與工具,如Arm-NN SDK、運算庫(compute library)、CMSIS-NN等。這些工具為晶片開發商帶來了巨大的方便,省去了從頭自行移植的步驟,節省了軟體工程師大量的心力。其次是Arm完整的生態系,支援廣泛的AI工作負載。AI的工作負載可以在CPU、GPU以及AI處理器(如NPU或DLP)上運作,而目前大約有40億個裝置(包括手機和IoT裝置)的AI工作負載都是仰賴Arm的處理器。生態系的完整性為客戶提供了更多選擇,同時也提供了優化最適於Arm平台的軟體/工具,協助客戶加速上市時程。
針對Arm架構處理器對於人工智慧與機器學習最大的優勢,徐達勇認為,效能與功耗是最基本的門檻,而Arm一直在效能表現與低功耗上領先業界。此外,Arm的生態系、解決方案的可擴充性以及開源軟體工具是其三大優勢。Arm不僅提供單一解決方案,而是擁有強大的生態系統,具備可擴展性的軟體工具等各式解決方案。這些優勢讓開發者能夠更快速地移植他們的機器學習模型和演算法,協助加速上市時程。
在AI應用進程腳步非常快的情況下,徐達勇提到Arm如何加速客戶開發的時間。首先,Arm的解決方案支援AI的應用,從小自Cortex-M,再一路到Cortex-A、Mali GPU以及NPU。這種可擴充性使得客戶能夠根據應用選擇最適合的效能。其次,Arm提供相應的軟體與工具,如運算庫、編譯器以及CMSIS-NN等,這些工具協助開發者快速移植他們的機器學習模型和演算法,進而加速上市時程。
關於生態系統在Arm的人工智慧發展上的角色與好處,徐達勇說明了生態系提供各式AI開發工具,以及合作夥伴提供優化最適於Arm平台的軟體/工具,協助客戶加速上市時程。無論是應用領域還是從軟硬體及工具的角度來看,Arm的生態系為客戶提供了更多選擇,同時也節省了開發時間,讓客戶專注於創新開發。在智能時代來臨的今天,Arm的努力與創新持續推動AI的發展與應用,為各行各業帶來更多可能性與便利性。