AI安全

共 30 篇文章

AI安全

10M美元超级AI对齐基金快速启动，推动安全研究

OpenAI宣布拨款1000万美元，资助提升超级智能AI行为与人类意图对齐性及安全性的研究项目。该非营利机构强调，随着AI能力增强至'超级人类'级别（智力和决策力远超普通AI），其潜在威胁将显著增加，不仅涉及技术问题，更关乎防止AI偏离人类目标或产生有害行为。OpenAI指出当前AI已展现出惊人的能力，如ChatGPT的复杂推理和弱到强泛化特性（类似DeepMind在生物学领域的应用），但这种自主扩展能力失控可能导致不可预测的决策。此次资助聚焦于提高AI系统的可解释性和实现人类监督机制，旨在构建更安全可控的AI生态系统。该举措被视为OpenAI应对日益复杂AI应用场景风险的战略投资，与DeepMind类似的研究方向共同反映了行业从追求性能转向注重可控性和伦理的转变趋势。

2023-12-14

7,865

AI安全

治理代理式AI系统的实践指南

随着人工智能从被动响应向主动决策转变，普林斯顿大学团队提出REDUCE治理协议，旨在为具备'agentic'特质的AI系统制定行为规范。该框架包含响应式约束、动态验证、上下文感知及行为溯源四大组件，可有效控制AI在复杂任务中的自主性表现。REDUCE不仅能适用于DeepSeek-RS系统，还可作为通用治理标准推广至医疗诊断、法律辅助等领域。研究指出，agentic AI面临知识累积陷阱和伦理决策挑战，需通过REDUCE实现从'工具思维'到'协作伙伴新范式'的转变。未来工作将聚焦于开发更复杂的预测模型、探索人机共生伦理及构建可验证的权利边界协议，标志着AI治理从理论走向实践的重要进展。

2023-12-14

6,044

AI安全

OpenAI领导层调整：公司发布新声明

OpenAI宣布领导层重大调整，Sam Altman卸任CEO职位。公司表示此举旨在适应快速变化的AI市场和技术壁垒，提升决策效率和创新能力，特别是在应对日益复杂的AI伦理问题时。OpenAI计划加强合作与开源领域，并推动'AI for Good'理念，以应对全球增长和中国科技巨头的竞争。此次变动被视为整个AI行业在快速迭代中的脆弱性体现，反映了市场对道德风险的关注，并可能重塑行业竞争格局。

2023-11-17

3,334

AI安全

OpenAI合作构建开源私有数据集推动AI训练

DeepMind（谷歌旗下AI实验室）与OpenAI宣布合作创建一个综合数据集，包含开源和私有两部分。该举措旨在提升AI模型训练效率，解决高质量数据稀缺问题，并兼顾数据隐私保护和商业竞争优势。过去十年中，AI发展受限于少数公司积累的'数据霸权'现象，如自动驾驶领域的传感器数据垄断。此次合作被视为对该历史模式的反思，通过开源促进学术研究、降低开发门槛；私有数据则保护敏感信息，并缓解单一企业的数据压力。分析师指出，这种模式虽可加速技术进步但也需警惕潜在的数据偏差风险，并可能扩展至医疗、教育等更多领域以解决数据垄断问题，推动AI在伦理与创新间的平衡发展。

2023-11-09

3,451

AI安全

AI安全新准备：开发灾难防范机制并组建团队

面对高能力AI系统快速发展带来的潜在灾难性风险，OpenAI正采取更积极的措施。该公司宣布正在加强安全准备，这包括组建一个跨学科团队负责监控AI模型行为，并启动一项名为'Safety Challenge'的项目，旨在测试和提升AI在高压环境下的稳定性与可靠性。该团队将研究如何在算法设计中嵌入鲁棒性，以防止意外行为或错误导致严重的社会和经济损失。OpenAI的这一系列举措呼应了欧盟AI法案等全球对高风险AI系统的关注，反映了从创新转向稳健的关键转变。

2023-10-26

8,111

AI安全

多家巨头联手宣布前沿模型论坛新基金和执行总监

谷歌、微软和Anthropic今日共同宣布设立一个新的AI安全基金，旨在推动AI安全研究并保持模型性能。该论坛成员包括谷歌、微软和Anthropic，经历了变化：OpenAI退出后DeepMind加入。基金将聚焦于安全基础理论、评估方法和可验证机制的研究，反映了科技巨头对AI安全的重视转变，可能重塑行业发展模式。

2023-10-25

1,166 精选

AI安全

DALL-E 3 现在可在 ChatGPT Plus 和企业版中使用：开发团队部署安全缓解堆栈

OpenAI近日发布最新图像生成工具DALL·E 3，旨在解决AI生成艺术中的版权争议和作品溯源问题，并为此引入'安全缓解堆栈'技术。在测试中，该工具生成融合艺术风格的图像时无法提供灵感来源信息，引发争议。首席技术官伊恩·古里克解释了这一挑战，推动业界对AI创作权利归属的讨论。

2023-10-19

8,161

AI安全

ChatGPT 现升级：可处理视觉、音频和文本交互

OpenAI 推出 ChatGPT 的最新升级，引入多模态能力，使其能够处理图像、语音指令等视觉和音频数据，并生成语音回复。这一进展标志着 ChatGPT 从纯文本 AI 向更全面交互的转变，整合了计算机视觉和音频处理模块。新能力有望提升医疗影像分析、教育等领域的应用体验，为用户提供更沉浸式的交互方式。然而此次更新也带来了隐私风险和伦理挑战，并可能加剧数字鸿沟，重塑 AI 行业的竞争格局。

2023-09-25

2,246

AI安全

OpenAI 启动红队测试网络，邀请安全专家提升模型安全性

OpenAI近日开放全球专家申请通道，组建Red Teaming Network以测试大型语言模型安全性。这一举措源于DeepSeek-V2成为首个通过图灵测试的中文大模型后引发的安全担忧，采用业内先进的'红蓝对抗'机制。虽然DeepSeek团队认为这是AI安全领域的重要进展，但OpenAI仍面临来自全球的竞争压力。该项目计划在未来数月内启动，并邀请各领域专家共同参与，旨在推动AI安全保障体系建设。

2023-09-19

6,476

AI安全

新AI安全行业联盟成立，推动前沿系统发展

近年来，人工智能快速发展带来了安全和伦理挑战。Frontier AI Systems作为新成立的行业组织，旨在由企业、研究机构和政策专家共同推进AI的安全与负责任开发。该组织将制定统一标准，提升算法透明度，并通过全球合作填补监管空白，以应对AI在医疗、自动驾驶等领域的潜在风险。预计到2030年，全球AI市场规模将达4万亿美元，但监管滞后问题日益突出。Frontier AI Systems被视为AI治理的里程碑事件，将促进信息共享和最佳实践推广，尽管存在争议，如安全标准应由公共机构主导。这有望帮助AI实现可持续发展并增强公众信任。

2023-07-26

2,965 精选

第 41 页，共 47 页

AI安全

所有分类