AI通过神经网络和领域随机化训练机器人手解决鲁比克魔方难题

2019年10月15日 15:00 5,893 次阅读

DeepMind团队开发的AI系统通过强化学习算法，成功训练一个类人机器人手臂在未知环境中复原鲁比克魔方。这一突破性研究首次展示了AI在实体操作上接近人类的灵活性，标志着人工智能领域的重大进展。然而，传统强化学习方法仍存在致命弱点：当机器人遇到训练中未出现过的物理干扰时，可能无法有效处理。

一项突破性研究正在将人工智能推向现实世界操作能力的边界。DeepMind团队开发的人工智能系统能够通过强化学习算法解决一个长期存在的难题：如何让机器在未知环境中表现出灵活的动作能力。

该项目的核心在于训练两个神经网络，使其能够控制一个类人机器人手臂完成鲁比克魔方的复原。这种能力对人工智能领域而言意义重大，因为它标志着AI首次在实体操作系统上展现出了接近人类的解决问题能力。

传统方法中，强化学习需要在现实环境中进行大量测试和数据收集。然而这种方法存在致命弱点——当机器人遇到训练中未出现过的物理干扰时，就会陷入

内容声明

本文内容基于公开市场信息与媒体报道进行整理，部分观点来自社区讨论。如涉及事实性问题，欢迎通过 xurj005@163.com 与我们指正，我们将及时核实并更新。

持续推送最新AI资讯，不错过重要内容

扫码关注 "AI Prism 智棱"