账号:
密码:
最新动态
 
产业快讯
CTIMES / 文章 /
强化学习:入门指南
 

【作者: Emmanouil Tzorakoleftherakis】2019年11月14日 星期四

浏览人次:【10372】

强化学习(Reinforcement learning)潜力无穷,能解决许多开发应用上面临的艰难决策问题,包括产业自动化、自主驾驶、电玩竞技游戏以及机器人等,因此备受瞩目。


强化学习是机器学习(Machine learning)的一种,指的是电脑透过与一个动态(dynamic)环境不断重复地互动,来学习正确地执行一项任务。这种尝试错误(trial-and-error)的学习方法,使电脑在没有人类干预、没有被写入明确的执行任务程式下,就能够做出一系列的决策。最著名的强化学习案例就是AlphaGo,它是第一支打败人类围棋比赛世界冠军的电脑程式。


强化学习的运作主要是仰赖动态环境中的资料—也就是会随着外部条件变化而改变的资料,像是天气或交通流量。强化学习演算法的目标,即是于找出能够产生最佳结果的策略。强化学习之所以能达成目标,是借着软体当中被称为主体 (agent)的部分在环境中进行探索、互动和学习的方法。
...
...

另一名雇主 限られたニュース 文章閱讀限制 出版品優惠
一般訪客 10/ごとに 30 日間 5//ごとに 30 日間 付费下载
VIP会员 无限制 20/ごとに 30 日間 付费下载
相关文章
CAD/CAM软体无缝加值协作
创新更容易!2024年受瞩目的Arduino创新产品简介
确保机器人的安全未来:资安的角色
双臂机器人引风潮 类人形应用尤欠东风
量子运算:打造自动驾驶汽车新领域
comments powered by Disqus
相关讨论
  相关新闻
» 意法半导体公布第三季财报 工业市场持续疲软影响销售预期
» 慧荣获ISO 26262 ASIL B Ready与ASPICE CL2认证 提供车用级安全储存方案
» 攸泰科技跃上2024 APSCC国际舞台 宣扬台湾科技竞争力
» 东芝推出高额定无电阻步进马达驱动器TB67S559FTG
» 艾迈斯欧司朗全新UV-C LED提升UV-C消毒效率


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK8B8CVTIA0STACUKN
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw