OpenAI 推出 gpt-oss-safeguard 开放权重推理模型，用于安全分类并支持开发者迭代自定义策略

2025年10月29日 08:00 3,161 次阅读

AI导读

OpenAI上周推出名为gpt-oss-safeguard的新安全模型，该机制基于开放权重推理架构开发。开发者可利用这一工具创建专属策略并实时优化模型表现，此举打破了该公司过去在安全政策方面的封闭形象。这不仅是OpenAI技术路线的重大调整，更预示着大型语言模型向安全领域延伸的新方向，并为AI伦理治理模式的革新带来契机。

标题：OpenAI公布新型安全模型，为开发者提供自定义策略工具来源：AI科技前沿（ID：AIFuture）日期：2023年10月【编者按】随着AI技术的日益普及，如何在发展的同时守住安全边界成为行业共同课题。本文解析OpenAI最新机制的技术逻辑与产业影响，探索大型语言模型向安全领域延伸的关键突破。 --- 在AI技术突飞猛进的当下，OpenAI于上周突然公布一项名为gpt-oss-safeguard的新机制，打破外界对该司安全政策一贯封闭性的认知。这项基于开放权重推理架构开发的模型，使开发者能够创建专属安全策略并实时迭代优化——这不仅是技术路线的重大调整，更意味着AI伦理治理模式正迎来革新契机。 **一、突破性技术：解构OpenAI的

内容声明

本文内容基于公开市场信息与媒体报道进行整理，部分观点来自社区讨论。如涉及事实性问题，欢迎通过 xurj005@163.com 与我们指正，我们将及时核实并更新。

关注微信公众号

持续推送最新AI资讯，不错过重要内容

扫码关注 "AI Prism 智棱"

OpenAI 推出 gpt-oss-safeguard 开放权重推理模型，用于安全分类并支持开发者迭代自定义策略

AI导读

关注微信公众号

AI安全

快速导航

OpenAI 推出 gpt-oss-safeguard 开放权重推理模型，用于安全分类并支持开发者迭代自定义策略

AI导读

关注微信公众号

相关推荐

为何韩国人如此热爱AI？

卫星学会自主定位目标，这意味着什么

6500人AI团队濒临反叛，Meta工程师控诉内部环境如炼狱

CVE-2026-35273遭ShinyHunters连攻两周，百企PeopleSoft失守被勒索

AI安全

快速导航