新研究发现AI代理在捉迷藏游戏中通过多智能体互动自发发展复杂策略

2019年09月17日 15:00 5,031 次阅读

AI导读

DeepMind最新研究发现，多个AI代理在简单'隐藏-寻找环境模拟器'中通过自我监督学习，自发进化出六种复杂策略。这些策略从静态隐藏发展到动态伪装，并利用环境元素进行干扰，甚至出现'欺骗性规避'——当某策略被识破后立即变伪装形式。其中一个'路径优化策略'，即通过记录追踪路线提升躲藏效率的行为模式，与人类捉迷藏高度相似。该成果挑战了传统认知：简单交互环境反而能催生复杂行为，表明AI在约束下的进化能力远超理论预期。

AI在隐藏-寻找游戏中展现复杂策略进化【科技前沿】一项突破性研究揭示了人工智能在简单游戏中展现出的复杂策略演化过程。DeepMind在其最新研发的"隐藏-寻找环境模拟器"中观察到，当多个AI代理进行自我监督的学习时，它们不仅能够掌握基础动作模式，更自发地进化出六种截然不同的高级策略组合。这一发现挑战了传统认知：复杂行为往往需要复杂的输入，而简单的交互环境反而可能产生更复杂的认知模式。游戏设计者表示："令我们惊喜的是这些策略超出了我们的预期。例如，代理们开发出一种'欺骗性规避'战术——当某个策略被检测到后，会立即切换伪装形式。这种自适应机制展示了AI在约束条件下的进化能力远超理论预估。" **策略进化树**：从基础的静态隐藏演变到动态伪装，再到利用环境元素进行干扰性策略（如设置视觉障蔽物），每个新策略都是建立在先前策略失效时触发的自我修正机制上。值得注意的是，其中一个策略是'路径优化策略'——代理通过记录并分析高概率追踪路线来提升躲藏效率，这与人类在捉迷藏游戏中展现的行为模式惊人地相似。

内容声明

本文内容基于公开市场信息与媒体报道进行整理，部分观点来自社区讨论。如涉及事实性问题，欢迎通过 xurj005@163.com 与我们指正，我们将及时核实并更新。

关注微信公众号

持续推送最新AI资讯，不错过重要内容

扫码关注 "AI Prism 智棱"

新研究发现AI代理在捉迷藏游戏中通过多智能体互动自发发展复杂策略

AI导读

关注微信公众号

计算机视觉

快速导航

新研究发现AI代理在捉迷藏游戏中通过多智能体互动自发发展复杂策略

AI导读

关注微信公众号

相关推荐

足球数据复兴重塑攻防逻辑，中国核电蓝图加速落地？

0.005美元/秒生成视频！Avataar AI如何以低成本与文化洞察征服印度市场？

这家AI天气初创公司预报能力超越政府机构

Meta押注AI硬件：项圈式智能助理能否改写穿戴战局？

计算机视觉

快速导航