当前位置:首页 > 科研论文

伯克利和Deepmind前赴后继,只为教出一个会做家务的机器人?_亚博APP手机版
本文摘要:新年初,伯克利发表了新的进展,他们教机器人做家务的能力更上一层楼。

亚博APP

新年初,伯克利发表了新的进展,他们教机器人做家务的能力更上一层楼。在最近的论文中,伯克利解释了他们如何让机器学会背诵人类的潜在台词或唯一的意思,而不是愚蠢地根据字面意思或奖励系统进行机械运动。举个例子,餐桌机器人上菜时,不是为了尽可能多地获得报酬,而是为了在电力供应等紧急情况下暂停盘子,而是为了尽可能多地获得报酬。甚至有必要刺穿盘子,这样你就可以得到更好的盘子(奖励)...当我真的看到这个消息时,第一反应是机器人真的很愚蠢。

我两岁的侄子会做这样一项非常简单的任务。第二反应是伯克利教机器人做家务的执着也太深了吧以前开发过引擎教机器人砖床单,做衣服,离开桌子。总之,机器人必须配合家务。

想挑战家务技能的除了伯克利,还有Deepmind。去年2月,Deepmind明确提出了新的自学模式计划支配SAC-X,协助机器人整理桌子和填充衣物。不久前,佐治亚理工学院的研究人员也公开发布了新的增强自学算法,并可以教机器人穿衣服。为什么这么多AI巨头不约而同地踏上家务训练之路?未来,我们能享受像卡拉先生那样明亮能干的家政机器人吗?本文试着说明这些困惑。

家务三十六计:家政机器人掌握了什么技能?首先,在这么多人类欺负者、AI巨头的帮助下,机器人学习了什么样的家务技能呢?让我们谈谈家政狂魔伯克利。早在去年,我们就了解过伯克利的标准化预测模式,它能够协助机器人自律自学和掌控大量的标准化基础技能,在此基础上自学预测主人的用意和任务共性,因而能够举一反三继续执行普遍的任务类别,茁壮成长为一个出色的家务多面手。

例如拉链裤毛巾、苹果、整理桌面等。伯克利还推出了深度自学模式Dex-NET,基于角点检测和捕捉策略,使机器人完成砖床单的困难任务。最值得注意的是,新的研究成果喜欢优化模型。机器人不仅可以完成标准化的任务,还需要推断优于解法,适应环境具有隐蔽条件的简单现实环境。

亚博APP

例如,在通常的actor-critic强化自学反馈机制中,如果主人拒绝机器人导航系统进入紫色门,机器人就不会自由选择最短的路径(传统意义上的合理解法),而是忽略了不刺穿路的花瓶。因为机器人不知道,所以主人不在乎花瓶是否会被刺穿。但是,如果机器人能够自己模拟和训练过去再次发生的不道德轨迹,例如主人仍然绕着花瓶回头,说明她尊重花瓶的原始状态,推测跨越花瓶最有可能获得报酬,应该强烈执着。

机器人具有洞察隐蔽条件的能力,意味着可以从一种状态中自学人类的喜好,系统需要无巨细列举所有现实环境的因果联系和条件,奖励函数也是直线机械,机器人可以自律模拟和自学过去的经验对于实现家务的任务来说,可以说是辨别主人的兴趣开展作业,必杀技。与伯克利相比,Deepmind只是对医疗这一高级任务感兴趣。然而,这并不阻碍它在家政领域闪烁的痉挛。

Deepmind的计划辅助控制SAC-X模型,目的是协助机器人探索和控制家务的基本技能。就像婴儿在乌龟和走路前需要协商和平衡,SAC-X也有助于机器控制一些核心视觉运动技能。例如,使用模拟手臂,按照正确的顺序,即使没有看过这个任务,也可以从零开始自学,拒绝成功地推荐物体。这样,在需要额外编程的前提下,就可以完成像桌面一样的简单任务。

亚博APP手机版

另外,乔治亚理工学院将布料引入自学框架,教机器人穿衣服的论文也很独特。因为衣服的布料材质各不相同,所以穿衣服的动作也不能遵循特定的运动轨迹,不会和布料发生简单的交流变化,机器人必须大大锻炼,模拟和优化各个子任务(拉边缘、拉角等),在大变化的环境条件下自学平稳的创新控制战略,最后完成了穿衣服的任务目标。

衬衫、毛衣、外套都是妥当的液体!听起来,大多数家务机器人都可以匹敌,但杯子是现实中需要看到的家务机器人,开始工作还是很快田老挝的傻瓜。例如,伯克利设计、Rethink。Robotics公司开发的家庭助手,制作毛巾需要15分钟,加利福尼亚州的FoldiMate发售的智能重叠机器可以按照程序将衣服卵石所需的方块手动配置在展台上,不节省太多人力,销售价格约为980美元(约为7000美元)…emmmm自己丰衣足食吧。

不觉得比人快还是比人高,用机器人做家务的性价比太低了。那么,既然不知道上司的人做家务,就教机器人自学这些技能,有什么意义呢?为什么做家务,去工厂搬砖头?这么多研究人才登场,教小学生的话,恐怕能通过清华。我觉得去工厂搬砖头也能减轻劳动力的紧张。

为什么要和家务比较呢原因是,家政任务获得了从零开始自学简单控制任务的训练环境,对标准化机械智能至关重要。首先,家政任务的真实性和多样性有助于智能体学如何用最多的先验科学知识解决问题的简单问题。先验科学知识是指不依赖经验的总结(类似于写好的程序,从结果推论过程)的元能力,通过观察学会推和识别。

机器人没有这样的天生科学知识,但是机器人服务的家庭和任务似乎都不可能开展预先编程。此时,训练机器人的标准化能力是最重要的。

亚博APP

虽然机器总有一天不可能享受像人一样的先验能力和通用性,但它几乎可以显示在每个学科和工作场所。但是,在很多横向领域,如工业、家务、语言等,先驱能力强的机械智能体可以低成本、低适应性、灵活地完成工作任务,解决问题的只有现在的人才能解决问题。另外,家政任务是视觉、触觉、运动、关节控制等一体化的任务,综合性强,这是其他碎片应用于没有的环境,有助于训练多功能合作的智能体。例如,伯克利教机器人从垃圾箱掉下本来看不见的东西,必须用照相机收集深度图像,构成模拟数据集,利用这个数据集训练质量卷积神经网络(GQ-CNN),对物体展开图像分割,确认捕获试验顺利的可能性,最后构成捕获顺利概率最低的战略一次培训,各种收费。

更重要的是,家务操作者的环境比工业机器人、电子游戏等更加牢固,充满着变化,任务的主观期待和隐蔽意义更加无法定义和预测,在看不见的情况下增加了训练的可玩性。与此同时,家政任务的培训成本也相对较低,更容易为公众解释,社会效益和营销价值丰收。

比起踢机器狗,在Dota中强奸真正的玩家,让机器做家务是最政治、最准确、最便宜、最好的训练方式。醉汉的意思:完成家务,这些研究有什么用?在家政机器人的背后,实际上说明了智能体本源的本质逻辑。

在简单的环境中,可以自己找到解决问题随机和非结构化问题的合理方案,安全地与环境交流,有效地完成任务。训练家政机器人主要有三个优点:一是培养更标准化的智能机器人,不需要太多指导,继续执行一系列任务,提高机器自动化的安全性和工作效率。二是有助于开发分层规划、感觉和推理小说的算法,帮助自动驾驶、工业自动化、智能物联网等领域解决问题,三是推进零样本自学、少样本自学等技术变革。

在缺乏外部奖励信号的情况下,算法也能很好地推理小说有不道德的意图,明显提高电器商品、内容产品推荐系统的体验。这样,为什么家务不会成为标准化智能体健康道路上无法跨越的垫脚石呢?最后,也许有人想问:不爱的人成为家务明星,我只关心机器人什么时候进我家铺床。


本文关键词:亚博APP,亚博APP手机版

本文来源:亚博APP-www.teleutev.com