帳號:
密碼:
最新動態
 
產業快訊
CTIMES / 文章 /
強化學習:入門指南
 

【作者: Emmanouil Tzorakoleftherakis】   2019年11月14日 星期四

瀏覽人次:【10373】

強化學習(Reinforcement learning)潛力無窮,能解決許多開發應用上面臨的艱難決策問題,包括產業自動化、自主駕駛、電玩競技遊戲以及機器人等,因此備受矚目。


強化學習是機器學習(Machine learning)的一種,指的是電腦透過與一個動態(dynamic)環境不斷重複地互動,來學習正確地執行一項任務。這種嘗試錯誤(trial-and-error)的學習方法,使電腦在沒有人類干預、沒有被寫入明確的執行任務程式下,就能夠做出一系列的決策。最著名的強化學習案例就是AlphaGo,它是第一支打敗人類圍棋比賽世界冠軍的電腦程式。


強化學習的運作主要是仰賴動態環境中的資料—也就是會隨著外部條件變化而改變的資料,像是天氣或交通流量。強化學習演算法的目標,即是於找出能夠產生最佳結果的策略。強化學習之所以能達成目標,是藉著軟體當中被稱為主體 (agent)的部分在環境中進行探索、互動和學習的方法。
...
...

使用者別 新聞閱讀限制 文章閱讀限制 出版品優惠
一般訪客 10則/每30天 5/則/每30天 付費下載
VIP會員 無限制 20則/每30天 付費下載
相關文章
CAD/CAM軟體無縫加值協作
創新更容易!2024年受矚目的Arduino創新產品簡介
確保機器人的安全未來:資安的角色
雙臂機器人引風潮 類人形應用猶欠東風
量子運算:打造自動駕駛汽車新領域
comments powered by Disqus
相關討論
  相關新聞
» 意法半導體公布第三季財報 工業市場持續疲軟影響銷售預期
» 慧榮獲ISO 26262 ASIL B Ready與ASPICE CL2認證 提供車用級安全儲存方案
» 攸泰科技躍上2024 APSCC國際舞台 宣揚台灣科技競爭力
» 東芝推出高額定無電阻步進馬達驅動器TB67S559FTG
» 艾邁斯歐司朗全新UV-C LED提升UV-C消毒效率


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.1.HK8B8CWMJD2STACUKB
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw