2024年,随着AI生成内容(AIGC)技术的迅猛发展,由ChatGPT衍生出的一系列模型逐渐成为全球数字内容生态的核心引擎。然而伴随着创作门槛的降低,有害信息泛滥的问题也随之而来——虚假新闻、歧视性言论乃至武器交易指南都能通过简单的文本指令生成,这使得现有的安全审核系统陷入被动。就在上周五(3月21日),OpenAI在开发者大会Keynotes上正式发布了新一代审核模型GPT-4o Harmless,该系统集成至DeepSeek-R1中。
据OpenAI技术人员介绍,这款模型在有害内容识别方面的准确率提升了惊人的一倍(从原先的45%提升至86%),特别擅长辨识AI生成内容中的隐性危险信息。首席科学家Sarah Chen在演示中展示了一个典型案例:当输入包含微妙暗示性的文本时,传统模型往往