親愛的我把AI模型縮小了- 模型減量與壓縮技術簡介

│新東西市集│東西講座│影音頻道│出版中心│智動化專區│

元件次系統自動控制

最新動態

產業快訊

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

汽配及移動科技產業，參展熱烈報名中!

CTIMES / 文章 /

親愛的我把AI模型縮小了- 模型減量與壓縮技術簡介

【vMaker Edge AI專欄 #08】

【作者： Jack OmniXRI】 2023年08月30日星期三

瀏覽人次：【2425】

1989年科幻電影「親愛的，我把孩子縮小了」，2015年「蟻人」，2017年「縮小人生」，以及我們從小看到大的多啦A夢「縮小燈」、「縮小隧道」，都不約而同的提到一個概念，就是可以透過一種神奇的機器，就能把人的體積大幅縮小但生理機能完全不減。這裡姑且不論是否符合物理定律，但如果真的能實現，就會像「縮小人生」中所提到的，可大幅減少地球資源的浪費，大幅改善人類的生存環境。雖然以上提及的技術可能我們這輩子都難以看到實現的一天，但把超巨大的AI模型縮小但仍保持推論精度不變，還是有很多方法可以達到的。接下來我們就來幫大家簡單介紹一下幾種常見技術。

1. AI模型組成元素

回顧一下本專欄三月份文章[1]第1小節提及的神經網路架構，其組成內容主要包括神經元內容（包含數量）、網路結構（神經元連接拓撲）及每個連結的權重值，如Fig. 2所示。簡單的卷積神經網路(CNN)如LeNet-5，就有約6萬個權重，而大型模型VGG16則有約1.38億個權重，到了現在流行的大型語言模型GPT-3已激激增到1750億個權重，更不要說像GPT-4已有超過一兆個權重。
...
...

使用者別	新聞閱讀限制	文章閱讀限制	出版品優惠
一般訪客	10則/每30天	5/則/每30天	付費下載
VIP會員	無限制	20則/每30天	付費下載

‧	以STM32生態系統擴充套件加速AI模型部署
‧	工程師工具箱內的秘密武器：AI與模擬的交集
‧	4種經過實證的AI演算法應用
‧	自行調適運算平台帶來高效能AI加速

comments powered by Disqus

相關討論

相關新聞

»	資策會四項創新技術勇奪ASOCIO DX AWARD獎項
»	資策會發表2025十大AI關鍵技術趨勢助企業導入生成式AI應用
»	衛福部攜手耶魯大學附醫促進醫療資訊優化應用
»	達梭SOLIDWORKS 2025即將上市加速用戶產品開發流程
»	亞大生醫系獲國科會GenAI Star生成式AI百工百業應用競賽優選

｜

｜

｜

｜

｜

｜

	︱	Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3 v3.20.1.HK8B8BTH3FASTACUKA
		地址:台北數位產業園區（digiBlock Taipei） 103台北市大同區承德路三段287-2號A棟204室電話 (02)2585-5526 #0 轉接至總機 / E-Mail: webmaster@ctimes.com.tw