一项突破性研究正在将人工智能推向现实世界操作能力的边界。DeepMind团队开发的人工智能系统能够通过强化学习算法解决一个长期存在的难题:如何让机器在未知环境中表现出灵活的动作能力。
该项目的核心在于训练两个神经网络,使其能够控制一个类人机器人手臂完成鲁比克魔方的复原。这种能力对人工智能领域而言意义重大,因为它标志着AI首次在实体操作系统上展现出了接近人类的解决问题能力。
传统方法中,强化学习需要在现实环境中进行大量测试和数据收集。然而这种方法存在致命弱点——当机器人遇到训练中未出现过的物理干扰时,就会陷入