机器人
AI安全新技:迭代放大分解复杂目标初探
2018年10月22日 15:00
2,351 次阅读
AI导读
卡内基梅隆大学研究者在阿尔法元中心实验室演示了一种名为'迭代放大'的AI安全技术,旨在解决当前人工智能在能力提升过程中面临的可控性挑战。这项由艾伦·德鲁克领导的五年计划指出,传统方法依赖预设奖励函数或标注数据指导AI行为,在复杂场景中表现不佳:要么陷入局部最优解,要么因目标描述模糊而失效。'迭代放大'技术通过允许AI在安全框架内自主探索边界,以期找到既能突破认知极限又可控的解决方案。
在阿尔法元中心的实验室里,一组来自卡内基梅隆大学的研究者正在演示一种颠覆性的AI安全技术——迭代放大。这项由首席科学家艾伦·德鲁克领导的五年计划,试图解决当前AI能力跃升与安全性之间的尖锐矛盾。虽然表面上这是一场关于早餐鸡蛋煎法的讨论,但从他们手中的基准测试图表就能看出这项技术的核心挑战——如何在AI系统突破人类认知边界时保持可控性。
传统方法依赖于预设的奖励函数或标注数据来指导AI行为,就像为一辆自动驾驶汽车画出导航路线图。这种方法在简单任务中有效,但在复杂场景下往往力不从心:它要么陷入局部最优解的陷阱,要么因为目标描述模糊而无法准确实现。就像人类很难向一个AI完整地解释
内容声明
本文内容基于公开市场信息与媒体报道进行整理,部分观点来自社区讨论。如涉及事实性问题,欢迎通过 xurj005@163.com 与我们指正,我们将及时核实并更新。
持续推送最新AI资讯,不错过重要内容
扫码关注 "AI Prism 智棱,在微信上分享给好友"
关注微信公众号
持续推送最新AI资讯,不错过重要内容
扫码关注 "AI Prism 智棱"