当前位置:昀景 >> 新闻资讯 > 机器人操作学习系列分享:基于图结构的视觉模仿    

机器人操作学习系列分享:基于图结构的视觉模仿

来源:CAAI认知系统与信息处理专委会      编辑:昀景智能      发布时间:2020/9/11

人类可以通过观察他人来学习技能。这种从观察中学习的能力—被称为视觉模仿[1]或第三人称模仿[2]。视觉模仿一直是人工智能中一个重要的研究课题。视觉模仿首先需要对演示者的视觉场景和随时间产生的场景变化有细致的理解,然后模仿者在自己的环境中产生类似的变化。因此视觉模仿可以归结为学习演示和模仿所处环境的视觉相似函数,通过模仿者的动作行为将视觉相似函数取最优值,得到正确的模仿行为。视觉相似性函数需要决定视觉观察中的哪些方面能够再现演示的技能,即函数需要定义模仿什么和忽略什么。

PMLR2020收录的《Graph-Structured Visual Imitation》中将视觉模仿作为视觉对应的问题,这篇论文基于计算机视觉方面的最新进展,如人类手指关键点检测器、合成增强实时训练的目标检测器、由视角变化[3]监督的点检测器和对每个演示所学习的多重视觉实体检测器。机器人 agent得到奖励的前提是其动作能够很好匹配演示与模仿场景中视觉实体的空间对应关系。文中提出的对实体及其空间配置的因式视觉表征可以在几分钟内成功地模仿各种操作技巧,并且只使用一次演示。该方法对复杂背景具有较强的鲁棒性,即使演示与模仿之间存在环境差异,也能有效泛化。


 
产品中心
 
» 2022年首批上海市职业技能等级认定人工智能训练师(一级)直接认定评审通过人员
» 元鼎智能获超亿元A轮融资 主攻室外智能清洁机器人
» 青耕1号这款高通量全自动核酸检测平台将为我们带来些什么
» 智能无人快递车现身上海,“无接触配送”助力抗疫
» 【青浦区】关于开展2022年人工智能产业项目扶持资金申报工作的通知
» 地下管廊巡检机器人在综合管廊里巡逻,守护智慧城市大动脉
» 简述机器人学习中的强化学习与模仿学习
» 面向机器人的学习算法简述
» 关于《上海市科技信用信息管理办法(试行)》的政策解读
» 关于印发《上海市科技信用信息管理办法(试行)》的通知
» 上海昀景智能科技有限公司
 
 
 
版权所有 © 上海昀景智能科技有限公司         地址:上海市闵行区颛兴东路1331号706室                 沪ICP备20012629号-1