账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
强化学习:入门指南
 

【作者: Emmanouil Tzorakoleftherakis】2019年11月14日 星期四

浏览人次:【10449】

强化学习(Reinforcement learning)潜力无穷,能解决许多开发应用上面临的艰难决策问题,包括产业自动化、自主驾驶、电玩竞技游戏以及机器人等,因此备受瞩目。


强化学习是机器学习(Machine learning)的一种,指的是电脑透过与一个动态(dynamic)环境不断重复地互动,来学习正确地执行一项任务。这种尝试错误(trial-and-error)的学习方法,使电脑在没有人类干预、没有被写入明确的执行任务程式下,就能够做出一系列的决策。最著名的强化学习案例就是AlphaGo,它是第一支打败人类围棋比赛世界冠军的电脑程式。


强化学习的运作主要是仰赖动态环境中的资料—也就是会随着外部条件变化而改变的资料,像是天气或交通流量。强化学习演算法的目标,即是于找出能够产生最佳结果的策略。强化学习之所以能达成目标,是借着软体当中被称为主体 (agent)的部分在环境中进行探索、互动和学习的方法。
...
...

另一名雇主 限られたニュース 文章閱讀限制 出版品優惠
一般訪客 10/ごとに 30 日間 5//ごとに 30 日間 付费下载
VIP会员 无限制 20/ごとに 30 日間 付费下载
相关文章
CAD/CAM软体无缝加值协作
创新更容易!2024年受瞩目的Arduino创新产品简介
确保机器人的安全未来:资安的角色
双臂机器人引风潮 类人形应用尤欠东风
量子运算:打造自动驾驶汽车新领域
comments powered by Disqus
相关讨论
  相关新闻
» 茂纶携手数位资安共同打造科技新未来
» 英国公司推出革新技术 将甲??转化为高品质石墨烯
» 韩国研发突破性半导体封装技术 大幅提升产能并降成本
» 美国联邦通讯委员会发布新规定 加速推动C-V2X技术
» DigiKey第16届年度DigiWish隹节大放送活动即将开始


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK8BT367PG8STACUK8
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw