真正的狗如何教机器人狗走路
谷歌研究人员没有给一个机械的四足动物的运动逐行编码,而是给它提供了真实幼崽的视频。现在它甚至可以追尾。
可以肯定的是,当波士顿动力公司的人形机器人进行后空翻或它的Spot狗机器人与人打架并打开一扇门时, 您会看到令人难以置信的硬件工程。但是您看不到的是极其复杂的基础代码,这使之成为可能。对您来说如此轻松的事情-好吧,也许不是后空翻,而只是走路-需要极端的协调,这是机器人专家必须复制的,这是一种协调工作的马达舞。
可怜那些不得不写出所有代码的工程师。在Google上,研究人员拥有一种秘密武器,可以教机器人移动机器人,这种机器人既省钱又更可爱:狗。他们从公共数据集中收集运动捕捉视频,然后将数据输入模拟器以创建电子版本的狗。然后,研究人员将数字狗的真实版本转换为他们的四足机器人Laikago的数字版本,该机器人具有矩形的身体和纤细的双腿。然后他们将这些算法移植到Laikago的物理版本中。(顺便说一下,该机器人以莱卡(Laika)的名字命名,莱卡是第一个进入地球轨道的动物。)
机器人的工作方式与生物狗完全不同。它有马达而不是肌肉,而且通常更僵硬。但是由于这项翻译工作,莱卡戈学会了像现实中的犬一样运动。不仅如此,它的学习步态比机器人制造商提供的最快步态要快-尽管公平地说,它还不够稳定。新系统可能是迈向机器人学习的第一步(抱歉),这不是通过详尽的编码而是通过观看动物奔跑和跳跃的视频来学习运动的方法。
AI研究人员Jason Peng说:“这种手动方法的缺点在于,它无法真正扩展我们希望机器人执行的所有技能。” “我们需要很长的工程时间才能提出不同的策略。”
通过这种新方法,强化学习算法可以完成大部分工作。即使它们都是四足动物,机器人的身体也与狗的身体完全不同,因此在计算机仿真中,机器人的数字版本必须弄清楚如何模仿狗的数字版本的运动而无需直接复制它的狗。机械师。Peng说:“因此,强化学习算法的作用是设法找到一种方法,使机器人尽可能接近原始参考运动。”
该算法尝试随机运动,并在接近狗的参考运动时获得数字“奖励”-基本是竖起大拇指的信息,说这很好,请再次执行这种操作。如果它尝试的不是很热门的东西,则会得到数字“缺点”,请不要再做这种事情。有了这个奖励系统,经过多次迭代,模拟机器人会自学成自己像狗一样运动。
下一个挑战被称为“模拟到真实”。也就是说,利用系统在仿真中所学到的知识,并使其在物理机器人中运行。这很棘手,因为模拟是真实世界的不完美且高度简化的版本。质量和摩擦力表示得尽可能准确,但并不完美。在数字世界中,模拟机器人的动作无法准确地映射到实验室中真实机器人的动作。
因此,Peng和他的同事建立的不是最终的机器人仿真,而是机器人行为的一系列可能性。例如,他们在模拟中随机分配了摩擦,并调整了从您发送机器人命令到实际执行命令之间的等待时间。Peng说:“我们的想法是,如果我们以足够的多样性训练仿真,那么它可能会学到足够好的一套策略,以使其中一种策略可以在现实世界中发挥作用。”
顺便说一下,所有这些策略对于机器人的起飞都是合理的-他们不希望机器人如此快速或剧烈地移动以至于会伤害到自己或人类。该系统已经在计算机仿真中犯了最灾难性的错误-记住那些缺点-因此,机器人不必在现实世界中犯下这些错误。但是,其中一些行为会导致步态比其他行为更好。尽管机器人缺乏狗的解剖结构,但它们最终还是表现出了类似狗的行为。研究人员甚至得到它追逐它不存在的尾巴,绕圈旋转。它也学到了一些根本不像狗一样的东西,比如艺术家创作的动画中的小舞。
需要明确的是,这并不是机器人学家第一次寻求动物运动的启发。波士顿动力公司的Spot机器人显然是根据四足动物的流体运动建模的,而其Atlas人形机器人则是根据人的运动建模的。通过精心设计的控制算法,Spot可以从这样的灵感中攀登最困难的地形。
这个新系统?没那么多。卡内基·梅隆大学(Carnegie Mellon University)的机器人专家克里斯·阿特克森(Chris Atkeson)说:“这东西在平坦的地板上走来走去。” “就崎terrain的地形而言,最先进的技术已经远远超越了它,特别是波士顿动力公司的产品。”
但是有一幅更大的图景:如果我们希望机器人在像家庭这样的环境中有用,他们就必须像我们学到的那样学习。想一想上一次您很难打开罐子的时候。您最终并没有通过砸掉顶部来陷入困境。您去了餐具抽屉,拿出勺子,撬开盖子的边缘,松开封条,因为您曾经看到另一个人也这样做。
“可以说,这就是我们所做的一切,”阿特克森说。“那是什么意思?好吧,这意味着您必须拥有一个庞大的资料库,您已经看到了其他人类所做的事情。如果您遇到的情况不在库中,则您必须查看库中的元素,找到几个看似相近的情况,然后插值或选择最接近的情况,并使用此技巧使其能够解决您真正关心的问题。”
建立这样的动作库将需要大量工作,这对于有腿的机器人很有用。但是,doggonit优于手动编码所有内容。
更新,美国东部时间4/3/20,下午2点:这个故事最初指出,研究人员实际上是使用公共数据集收集了自己的运动捕捉视频。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://ispeak.vibaike.com/31234