账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
强化学习:入门指南
 

【作者: Emmanouil Tzorakoleftherakis】2019年10月29日 星期二

浏览人次:【12155】

强化学习(Reinforcement learning)潜力无穷,能解决许多开发应用上面临的艰难决策问题,包括产业自动化、自主驾驶、电玩竞技游戏以及机器人等,因此备受瞩目。


强化学习是机器学习(Machine learning)的一种,指的是电脑透过与一个动态(dynamic)环境不断重复地互动,来学习正确地执行一项任务。这种尝试错误(trial-and-error)的学习方法,使电脑在没有人类干预、没有被写入明确的执行任务程式下,就能够做出一系列的决策。最著名的强化学习案例就是AlphaGo,它是第一支打败人类围棋比赛世界冠军的电脑程式。


强化学习的运作主要是仰赖动态环境中的资料—也就是会随着外部条件变化而改变的资料,像是天气或交通流量。强化学习演算法的目标,即是于找出能够产生最佳结果的策略。强化学习之所以能达成目标,是借着软体当中被称为主体 (agent)的部分在环境中进行探索、互动和学习的方法。
...
...

另一名雇主 限られたニュース 文章閱讀限制 出版品優惠
一般訪客 10/ごとに 30 日間 5//ごとに 30 日間 付费下载
VIP会员 无限制 20/ごとに 30 日間 付费下载
相关文章
CAD/CAM软体无缝加值协作
创新更容易!2024年受瞩目的Arduino创新产品简介
确保机器人的安全未来:资安的角色
双臂机器人引风潮 类人形应用尤欠东风
量子运算:打造自动驾驶汽车新领域
comments powered by Disqus
相关讨论
  相关新闻
» 智慧校园 ICT+AI 把关 7-11未来超商X-STORE 8启动
» 金属中心於2024 TASS展示多项创新技术 携手产业加速绿色转型
» 锐能EMS率先接入台电ELMO系统 助力社区强化充电安全性与电网韧性
» 金属中心研发成果加值五金产业硬底气 抢占全球供应链席次
» 众福科赴德国慕尼黑电子叁展 商用智能充电站显示器首度亮相


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK8BF720RUESTACUKH
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw