強化學習：入門指南

│新東西市集│東西講座│影音頻道│出版中心│智動化專區│

元件次系統自動控制

最新動態

產業快訊

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

汽配及移動科技產業，參展熱烈報名中!

CTIMES / 文章 /

強化學習：入門指南

【作者： Emmanouil Tzorakoleftherakis】 2019年11月14日星期四

瀏覽人次：【10373】

強化學習（Reinforcement learning）潛力無窮，能解決許多開發應用上面臨的艱難決策問題，包括產業自動化、自主駕駛、電玩競技遊戲以及機器人等，因此備受矚目。

強化學習是機器學習（Machine learning）的一種，指的是電腦透過與一個動態（dynamic）環境不斷重複地互動，來學習正確地執行一項任務。這種嘗試錯誤（trial-and-error）的學習方法，使電腦在沒有人類干預、沒有被寫入明確的執行任務程式下，就能夠做出一系列的決策。最著名的強化學習案例就是AlphaGo，它是第一支打敗人類圍棋比賽世界冠軍的電腦程式。

強化學習的運作主要是仰賴動態環境中的資料—也就是會隨著外部條件變化而改變的資料，像是天氣或交通流量。強化學習演算法的目標，即是於找出能夠產生最佳結果的策略。強化學習之所以能達成目標，是藉著軟體當中被稱為主體（agent）的部分在環境中進行探索、互動和學習的方法。
...
...

使用者別	新聞閱讀限制	文章閱讀限制	出版品優惠
一般訪客	10則/每30天	5/則/每30天	付費下載
VIP會員	無限制	20則/每30天	付費下載

‧	CAD/CAM軟體無縫加值協作
‧	創新更容易！2024年受矚目的Arduino創新產品簡介
‧	確保機器人的安全未來：資安的角色
‧	雙臂機器人引風潮類人形應用猶欠東風
‧	量子運算：打造自動駕駛汽車新領域

comments powered by Disqus

相關討論

相關新聞

»	意法半導體公布第三季財報工業市場持續疲軟影響銷售預期
»	慧榮獲ISO 26262 ASIL B Ready與ASPICE CL2認證提供車用級安全儲存方案
»	攸泰科技躍上2024 APSCC國際舞台宣揚台灣科技競爭力
»	東芝推出高額定無電阻步進馬達驅動器TB67S559FTG
»	艾邁斯歐司朗全新UV-C LED提升UV-C消毒效率

｜

｜

｜

｜

｜

｜

	︱	Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3 v3.20.1.HK8B8CWMJD2STACUKB
		地址:台北數位產業園區（digiBlock Taipei） 103台北市大同區承德路三段287-2號A棟204室電話 (02)2585-5526 #0 轉接至總機 / E-Mail: webmaster@ctimes.com.tw