机器人学习中的强化学习与模仿学习:基于值函数的方法，策略搜索的方法和模型的方法等子方向-www.yunjingai.cn

当前位置：昀景 >> 机器人知识 > 简述机器人学习中的强化学习与模仿学习

简述机器人学习中的强化学习与模仿学习

来源：CAAI认知系统与信息处理专委会编辑：昀景智能发布时间：2020/12/12

现代机器人学习技术的两大主要研究方向为强化学习和模仿学习。强化学习技术由加拿大计算机科学家Richard S. Sutton 和其博士阶段导师Andrew G. Barto 所倡导，强化学习的基本模型构建在人类的认知心理学和行为科学的研究基础之上。通过观测人类和其他动物基于反馈的技能学习机制，强化学习将学习目标设定为大化环境给予智能体特定行动的奖励。智能体通过在环境中进行不断的探索，逐步发现奖励回报较G的区域，并在该区域附近进行更多的进一步的探索。如此反复，终习得目标任务上的执行策略。经过数十年的发展，强化学习技术逐步演变出了基于值函数的方法，基于策略搜索的方法，基于模型的方法等子方向。

产品中心

» 2022年首批上海市职业技能等级认定人工智能训练师（一级）直接认定评审通过人员
» 元鼎智能获超亿元A轮融资主攻室外智能清洁机器人
» 青耕1号这款高通量全自动核酸检测平台将为我们带来些什么
» 智能无人快递车现身上海，“无接触配送”助力抗疫
» 【青浦区】关于开展2022年人工智能产业项目扶持资金申报工作的通知
» 地下管廊巡检机器人在综合管廊里巡逻,守护智慧城市大动脉
» 简述机器人学习中的强化学习与模仿学习
» 面向机器人的学习算法简述
» 关于《上海市科技信用信息管理办法（试行）》的政策解读
» 关于印发《上海市科技信用信息管理办法（试行）》的通知
» 上海昀景智能科技有限公司