这只机器人狗教自己走路，翻身和导航障碍，经过一小时的训练

研究人员发布了一段视频，其中4腿机器人最初是在空中挥舞着腿，然后挣扎，然后10分钟，它可以采取措施。它从背部滚下来，甚至被一名研究人员用棍子撞倒。

加利福尼亚大学伯克利分校的人工智能研究员Danijar Hafner与他的同事们一起使用强化学习训练机器人。

Hafner通过电子邮件向Dailymail.com解释说：“通常，机器人通过大量的反复试验和错误来学习，这些计算机模拟的速度比实时快得多。”

‘在解决了一项任务之后，诸如站立并在模拟中行走之后，学习的行为然后在物理机器人上运行。

‘但是模拟无法捕获现实世界的复杂性，因此在模拟中效果很好的行为可能无法解决现实世界中的任务。”

研究人员在其论文中说：“梦想家算法最近通过计划在学习的世界模型中进行计划表现出了巨大的希望，可以从少量的互动中学习。”

‘学习一种世界模型来预测潜在行动的结果，可以在想象中进行计划，从而减少实际环境中所需的反复试验量。”

‘A roboticist will need to do this for each and every task [or] problem they want the robot to solve,’ Lerrel Pinto, an assistant professor of computer science at New York University, who specializes in robotics and machine learning, explains to MIT Technology Review.

研究小组引用了这种技术的其他障碍：爱游戏ayx体育

他们在研究摘要中指出：“虽然梦想家表现出令人鼓舞的结果，但在许多小时内学习硬件会在机器人身上造成可能需要人类干预或修复的磨损。”

‘此外，还需要更多的工作来通过更长的时间来探索梦想家和我们的基线的极限。