帳號:
密碼:
最新動態
產業快訊
CTIMES/SmartAuto / 新聞 /
英特爾展示AI推論效能 加速人工智慧大規模落地應用
 

【CTIMES/SmartAuto 王岫晨 報導】   2023年09月14日 星期四

瀏覽人次:【2324】

MLCommons於美國時間9月11日針對60億個參數的大型語言GPT-J,以及電腦視覺和自然語言處理模型發表MLPerf Inference v3.1效能基準測試結果。英特爾提交Habana Gaudi2加速器、第4代Intel Xeon可擴充處理器和Intel Xeon CPU Max系列的測試結果。這些結果不僅顯示英特爾在AI推論方面可提供具競爭力的效能表現,更強化英特爾的承諾-在客戶端、邊緣、網路、雲端等一連串AI工作負載中,讓AI更容易大規模地落實應用。

HabanaGaudi2GPT
HabanaGaudi2GPT

英特爾執行副總裁暨資料中心和AI事業群總Sandra Rivera指出,正如同近期MLCommons的結果,展示出英特爾擁有強勁、極具競爭力的AI產品組合,能夠滿足客戶對於高效能、高效率深度學習模型推論和訓練的需求,適合用在最小到最大的各種AI模型,並提供領先的性價比。

在今年6月更新的MLCommons AI訓練和Hugging Face效能基準測試,驗證了Gaudi2在最先進視覺語言模型方面的效能優勢;而9月11日的結果近一步強化英特爾是滿足AI運算需求,能夠替代同類型競品的可行方案。

每位客戶均有獨特的考量,而英特爾提供可解決一連串AI工作負載推論與訓練難題的產品,將AI落實到每個角落。英特爾的AI產品讓客戶能夠根據各自的效能、效率和成本目標,在選擇最佳AI解決方案時擁有靈活性和選項,同時協助客戶打破封閉的生態系。

Habana Gaudi2結果:Habana Gaudi2的GPT-J推論效能結果,為其極具競爭力的效能提供有力的驗證。

●Gaudi2在GPT-J-99和GPT-J-99.9的伺服器查詢(query)和離線樣本推論效能,分別為每秒78.58個查詢和每秒84.08個樣本。

●Gaudi2的效能是NVIDIA A100的2.4倍(伺服器)和2倍(離線)。

●Gaudi2的提交結果使用FP8,在此新資料類型的準確度高達99.9%。

Gaudi2大約每6週至8週釋出一次軟體更新,英特爾預期在MLPerf基準測試中繼續提升效能並擴大模型覆蓋範圍。

Intel Xeon結果:英特爾提交第4代Intel Xeon可擴充處理器的結果,其中包含GPT-J在內的所有7項推論基準測試。這些結果展現出通用AI工作負載的優異效能,包含視覺、語言處理、語音和音訊翻譯模型,以及規模更大的DLRM v2推薦和ChatGPT-J模型。此外,英特爾仍是唯一一家使用業界標準深度學習生態系軟體來提交公開CPU結果的供應商。

●使用最流行的AI框架與函式庫建立並部署通用AI工作負載,第4代Intel Xeon可擴充處理器為其理想之選。1篇新聞文章約1,000字至1,500字的GPT-J 100字摘要工作,第4代Intel Xeon處理器在離線模式下每秒可總結2個段落,即時伺服器模式下每秒總結1個段落。

●英特爾首次提交Intel Xeon CPU Max系列的MLPerf結果,該系列可提供高達64GB的高頻寬記憶體。在GPT-J方面,它是唯一能夠達成99.9%準確度的CPU,這對於需要最高精準度的應用而言十分重要。

●英特爾和原始設備製造商(OEM)客戶合作,提交他們自己的結果,進一步展現搭載Intel Xeon處理器通用伺服器的AI效能可擴展性和廣泛可用性,這些伺服器能夠滿足客戶的服務等級協議(SLA)。

MLPerf被普遍認為是AI效能方面最具聲譽的基準測試,能夠進行公平、可重現的效能比較。英特爾預計將為下次的MLPerf基準測試提交新的AI訓練結果。效能持續不斷的更新,代表英特爾致力於支援客戶,並針對每個AI節點提出解決方案-從低成本的AI處理器,再到網路、雲端和企業用戶所需的最高效能AI硬體加速器和GPU。

關鍵字: PaaS  人工智慧  OpenAI  ChatGPT  INTEL(英代爾, 英特爾
相關新聞
AI走進田間 加拿大團隊開發新技術提升農食產業永續發展
美國國家實驗室打造超級電腦 異構運算架構滿足HPC和AI需求
醫生實測:ChatGPT在診斷疾病方面更勝一籌
Red Hat收購Neural Magic 帶來生成式AI模型優化演算法
沙崙科學城前進人工智慧暨物聯網展 展示AI跨域應用實力
comments powered by Disqus
相關討論
  相關文章
» SiC MOSFET:意法半導體克服產業挑戰的顛覆性技術
» 揮別製程物理極限 半導體異質整合的創新與機遇
» STM32MP25系列MPU加速邊緣AI應用發展 開啟嵌入式智慧新時代
» STM32 MCU產品線再添新成員 STM32H7R/S與STM32U0各擅勝場
» STM32WBA系列推動物聯網發展 多協定無線連接成效率關鍵


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.1.HK8BP80JAUSSTACUKI
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw