研究人员发布了一段视频,其中4腿机器人最初是在空中挥舞着腿,然后挣扎,然后10分钟,它可以采取措施。它从背部滚下来,甚至被一名研究人员用棍子撞倒。
加利福尼亚大学伯克利分校的人工智能研究员Danijar Hafner与他的同事们一起使用强化学习训练机器人。
Hafner通过电子邮件向Dailymail.com解释说:“通常,机器人通过大量的反复试验和错误来学习,这些计算机模拟的速度比实时快得多。”
‘在解决了一项任务之后,诸如站立并在模拟中行走之后,学习的行为然后在物理机器人上运行。
‘但是模拟无法捕获现实世界的复杂性,因此在模拟中效果很好的行为可能无法解决现实世界中的任务。”
研究人员在其论文中说:“梦想家算法最近通过计划在学习的世界模型中进行计划表现出了巨大的希望,可以从少量的互动中学习。”
‘学习一种世界模型来预测潜在行动的结果,可以在想象中进行计划,从而减少实际环境中所需的反复试验量。”
‘A roboticist will need to do this for each and every task [or] problem they want the robot to solve,’ Lerrel Pinto, an assistant professor of computer science at New York University, who specializes in robotics and machine learning, explains to MIT Technology Review.
研究小组引用了这种技术的其他障碍:爱游戏ayx体育
他们在研究摘要中指出:“虽然梦想家表现出令人鼓舞的结果,但在许多小时内学习硬件会在机器人身上造成可能需要人类干预或修复的磨损。”
‘此外,还需要更多的工作来通过更长的时间来探索梦想家和我们的基线的极限。
‘最后,我们认为解决了更具挑战性的任务,可能是通过将快速现实世界学习的好处与模拟器的好处相结合,作为一个有影响力的未来研究方向。’
在另一项研究中,德国马克斯·普朗克智能系统研究所(MPI-IS)的研究人员在新研究中透露,他们的机器人狗被称为Morti,可以通过使用包括其脚下的传感器的复杂算法来轻松走路。
‘如果动物跌跌撞撞,那是一个错误吗?如果一次发生一次。但是,如果经常跌跌撞撞,它可以使我们对机器人行走的能力进行衡量。’