AI安全新技：迭代放大分解复杂目标初探

2018年10月22日 15:00 2,351 次阅读

AI导读

卡内基梅隆大学研究者在阿尔法元中心实验室演示了一种名为'迭代放大'的AI安全技术，旨在解决当前人工智能在能力提升过程中面临的可控性挑战。这项由艾伦·德鲁克领导的五年计划指出，传统方法依赖预设奖励函数或标注数据指导AI行为，在复杂场景中表现不佳：要么陷入局部最优解，要么因目标描述模糊而失效。'迭代放大'技术通过允许AI在安全框架内自主探索边界，以期找到既能突破认知极限又可控的解决方案。

在阿尔法元中心的实验室里，一组来自卡内基梅隆大学的研究者正在演示一种颠覆性的AI安全技术——迭代放大。这项由首席科学家艾伦·德鲁克领导的五年计划，试图解决当前AI能力跃升与安全性之间的尖锐矛盾。虽然表面上这是一场关于早餐鸡蛋煎法的讨论，但从他们手中的基准测试图表就能看出这项技术的核心挑战——如何在AI系统突破人类认知边界时保持可控性。

传统方法依赖于预设的奖励函数或标注数据来指导AI行为，就像为一辆自动驾驶汽车画出导航路线图。这种方法在简单任务中有效，但在复杂场景下往往力不从心：它要么陷入局部最优解的陷阱，要么因为目标描述模糊而无法准确实现。就像人类很难向一个AI完整地解释

内容声明

本文内容基于公开市场信息与媒体报道进行整理，部分观点来自社区讨论。如涉及事实性问题，欢迎通过 xurj005@163.com 与我们指正，我们将及时核实并更新。

关注微信公众号

持续推送最新AI资讯，不错过重要内容

扫码关注 "AI Prism 智棱"

AI安全新技：迭代放大分解复杂目标初探

AI导读

关注微信公众号

机器人

快速导航

AI安全新技：迭代放大分解复杂目标初探

AI导读

关注微信公众号

相关推荐

AI工具Codex如何让财务团队从真实数据中构建MBRs和其他模型？

OpenAI将如何整合ChatGPT与Codex？

美加将开展双边实验 5G助力自主设备边境传输“战场情报”

Google brings agentic AI and vibe-coded widgets to

机器人

快速导航