人工智慧的應用已經出現在現實生活中,而非純粹電影中的新潮科技,例如常見的人臉辨識、自動駕駛、安防監控、智慧家庭、智慧攝影機等,都已透過人工智慧的技術來達成。
其中,最核心的就是深度學習的技術,它經由大量輸入數據,在透過演算法進行分析,讓機器學會如何進行事物的判斷與預測,也就是我們常見到的大數據分析。目前在中國就有如商湯科技、螞蟻金服等公司運用大數據分析,在市場上取得先機,中國也有科技公司專門人工智慧晶片,欲搶攻這塊新興市場。
寒武紀深度學習處理器晶片Cambricon-1a
圖1 : 寒武紀於2018年發表新一代AI晶片,使用台積電16奈米製程(Source:bangqu)。 |
|
中國寒武紀科技(Cambricon Technologies)所研發的Cambricon-1A是一款深度學習專用處理器晶片(NPU),其高性能硬體架構及軟體支援Caffe、Tensorflow、MXnet等主流AI開發平台,是目前已實際商用的深度學習處理器IP產品,並將應用於電腦視覺、語音辨識、自然語言處理等領域。
當前寒武紀的業務中,包含終端處理器的IP授權,智慧IP指令集可授權整合到手機、安防、穿戴式設備等終端晶片中,客戶集中在SoC廠商。另一方面,寒武紀也和伺服器廠商合作,其產品能作為PCI-E放置雲端伺服器上。最後則是從B2C切入,讓玩具、語音助手等產品具備智慧化功能。
近期寒武紀也發表兩款人工智慧相關產品,包括Cambricon MLU100雲端智慧晶片、寒武紀1M終端智慧處理器IP產品。
圖2 : Cambricon MLUv01人工智慧晶片(Source:寒武紀)。 |
|
MLU100採用了寒武紀最新的MLUv01架構和台積電16nm先進製程,理論峰值速度達每秒128兆次定點運算,且峰值功耗不超過110瓦;而第三代IP產品寒武紀1M則採用台積電的7nm製程。兩款新品可支援視覺、語音、自然語言處理、資料採擷等各類應用,支持各類深度學習和機器學習演算法。
華為麒麟970
圖3 : 華為發表新一代麒麟970產品(Source:Android Authority)。 |
|
另外中國知名資通訊業者華為也推出麒麟970人工智慧晶片,採用台積電製造,將應用於機器學習以及相關應用程序上。該晶片以異質運算架構大幅提升AI的運算能力,內建獨立的神經網路處理單元。其專用硬體處理單元專用於機器學習和AI應用程式。
圖4 : 麒麟970採用台積電10奈米製程,以及A7處理器(Source:Thirty Seven Tech)。 |
|
麒麟970採用台積電10奈米晶片組製程技術(耗電量減少20%、體積減少 40%),擁有8核心CPU(時脈最高達2.4GHz),新世代12核心GPU(Mali G72MP12)、麒麟NPU(1.92T FP16 OPS)、影像訊號處理器(Image DSP)(512bit SIMD)、雙攝影鏡頭ISP(具備臉部、動作偵測)以及i7感應處理器。
瑞芯微
瑞芯微電子(Rockchip)則在今年度的CES上發表高性能AI處理器RK3399Pro,其採用CPU、GPU、NPU結合的硬體結構設計,NPU運算性能高達2.4TOPs,具高性能、低功耗、開發容易等優勢。
RK3399Pro AI晶片採用big.LITTLE大小核CPU架構——雙核心Cortex-A72+四核心Cortex-A53。另外,該晶片還內建四核心Arm高階GPU Mali-T860,整合更多頻寬壓縮技術,整體性能優異。
RK3399Pro具備極強的AI運算性能,是瑞芯微首次採用CPU+GPU+NPU硬體結構設計的AI晶片,其整合的NPU融合瑞芯微在機器視覺、語音處理、深度學習等領域的多年經驗。相較傳統非AI晶片,典型深度神經網路Inception V3、ResNet34、VGG16等模型在RK3399Pro晶片上的運行效果表現出眾。
2018年5月,瑞芯微Rockchip發布運行在旗下RK3399晶片平台的基於深度學習的目標檢測技術方案,可為高端AI人工智慧行業提供准Turnkey解決方案,可同時支持Android及Linux系統,其目標檢測速率達到8幀/秒以上。
針對AI人工智慧市場和技術需求,Rockchip在性能強大的RK3399平台上,對MobileNet SSD網絡進行專項優化,使得高精度的MobileNet SSD300 1.0運行幀率達到8幀以上,精度略低而速度更快的MobileNet SSD300 0.75的運行幀率超過11幀。
此一技術解決方案也支持Google的TensorFlow Object Detection訓練導出的TensorFlow Lite模型,目前已有大量基於TensorFlow Object Detection的使用案例,涵蓋從面部到物體的各類檢測,是工業上普及最高的目標檢測框架之一。
瑞芯微Rockchip基於RK3399晶片平台的深度學習目標檢測技術解決方案可同時支持Android或Linux系統,提升使用目標檢測技術的AI產品的用戶體驗,大幅縮短研發周期。
華夏芯研發人工智慧晶片平台
圖5 : 華夏芯BEIJI-GP8300 SoC晶片(Source:華夏芯)。 |
|
在CES2018消費電子展上,華夏芯向全球發布了領先的CPU/DSP處理器IP和AI專用處理器IP,以及基於前述IP、支持雙目立體視覺與目標識別等功能的異構多核SoC晶片北極星。
華夏芯嵌入式CPU/DSP處理器IP作為嵌入式高端64位超標量處理器,實現了亂序多發射的超標量流水線,支持1~4個核心,單核主頻最高達2~3GHZ頻率;新增的可變長向量單元可提供強大的並行計算能力;支持2D DMA引擎和加速器專用接口(PXI),能夠實現CPU與AI處理器等外部模組之間的高速數據傳輸。
華夏芯嵌入式AI處理器IP提供350 GFLOPS - 2.80 TFLOPS的浮點計算能力以及雙倍以上的定點計算能力,基於專用、通用相互融合的異構計算體系架構,支持各種主流深度學習框架的無縫對接,擅長多任務、多數據並行計算。
北極SoC整合4核華夏芯64位超標量CPU/DSP和雙核華夏芯AI專用處理器。針對AI應用碎片化的特點,支持算法定制優化,幫助應用廠商快速開發AI系統並實現商業化。
採用異構計算架構與CPU+設計理念。使用一套相同工具鏈,支持CPU、DSP、AI在統一地址上實現更高效率的協同計算與存儲,易於編程、調試和優化,大幅降低了系統開發與調試的人力、週期和難度。
作為AI單晶片處理器平台,北極星特別適用於在智慧安防監控、機器人、電腦視覺、汽車雷達探測、語音識別、智慧駕駛,以及工業4.0、智慧家居等應用領域。
地平線發表征程與旭日兩款AI處理器
圖6 : 地平線發表旭日與征程兩款處理器(Source:horizon-robotics)。 |
|
2017年獲得Intel一億美元投資的中國地平線推出了征程(Journey)和旭日(Sunrise)兩款處理器,都屬於嵌入式AI視覺晶片,分別針對智慧駕駛和智慧攝影鏡頭。
兩款晶片性能可達到1Tops,即時處理1080P-30幀,每幀可同時對200個目標進行檢測、跟蹤、識別,典型功耗為1.5W。兩款晶片採用關注模型(Attention Engine)認知模型(Cognition Engine)的資料處理流模式,透過這一個組合演算法,晶片的運算速度可以提升10倍以上。利用邊緣學習,模型可以不斷提升自己,錯誤率已降低至50%以下。
征程1.0處理器具備對機動車、非機動車、車道線、交通標誌、紅綠燈等多類目標進行精準即時檢測與識別的處理能力,可支援L2級別的輔助駕駛系統。旭日1.0系列處理器集合了深度學習演算法,支援在前段實現大規模人臉檢測跟蹤、視訊結構化,可應用於智慧城市、智慧商業等。
地平線為機構提供高性能、低功耗、低成本、完整開放的嵌入式人工智慧解決方案。面向自動駕駛、智慧城市、智慧零售等應用場景,為多種終端設備裝上人工智慧。
圖7 : 地平線發表的嵌入式AI視覺晶片,分別針對智慧駕駛和智慧攝影鏡頭應用領域(Source:芯智?)。 |
|
地平線具有世界領先的深度學習和決策推理算法開發能力,將算法集成在高性能、低功耗、低成本的嵌入式人工處理器及軟硬體平台上。基於創新的人工智慧專用處理器架構BPU(Brain Processing Unit),地平線自主設計研發了中國首款全球領先的嵌入式人工智慧視覺晶片—針對自動駕駛的征程(Journey)系列處理器和面向智慧攝像頭的旭日(Sunrise)系列處理器,並向產業提供完整解決方案。
在智慧城市和智慧零售等領域,地平線攜手夥伴,基於中國應用場景,提供客製化解決方案,目前已經與製造業者、購物中心、生活家居業、知名品牌商達成合作,積極搭建開放的嵌入式人工智慧產業生態,與產業上下游共同合作發展。
**刊頭圖:中國各家科技大廠正如火如荼研發AI相關應用晶片。