在当今快速发展的科技领域,人工智能(AI)常被类比为一种神秘的黑箱技术。过去几年中,从硅谷企业家到政策制定者,许多人用一个流行文化中的幽默比喻来描述AI的现状——就像动画系列《South Park》(南园子公园)中的一个集数所展示的那样,这套逻辑简单却充满漏洞。表面上看,AI正从一个不明确的基础阶段跃入远期的变革目标,但实际上中间步骤缺失了,这引发了广泛讨论。
事件始于2024年初伦敦的一场反AI抗议活动,参与者悬挂标语,呼吁在技术完全明确前暂停推理。这个行动是由Pause AI(暂停人工智能的组织)发起,它作为一个国际抗议团体,在社交媒体上发布了呼吁内容:'在我们搞清楚第二步到底是什么之前,不要随便推进AI。'乍一看,这似乎是一个讽刺性的meme(互联网俚语),但它实际上反映了AI领域当前的争议状态。就像《South Park》1998年播出的集数'Gnomes'一样,该动画讽刺了粗率的经济提升策略。
回想那个卡通集数,在一个夜晚,孩子们发现了一群gnomes(一种可爱的小精灵)偷偷潜出家门去偷取穿在床上的underpants,然后声称他们将在第三阶段实现巨大收益。编剧用这种夸张方式来嘲笑一种常见的商业计划:收集某些资源后迅速获利,却忽略了关键中间步骤。Pause AI的抗议者借鉴了这一讽刺:在AI发展中,'第一步是构建超级智能模型',然后直接跳到'第三步实现全球变革',但第二步——或许是监管或实际应用机制——仍然模糊不清。他们认为AI不应盲目推进,直到我们对潜在影响有更清晰的认识为止。
另一方面,AI的拥护者往往忽略这些不确定性。他们相信,正如OpenAI(开放人工智能公司)首席科学家Jakub Pachocki最近描述的那样,AI是'一种能带来经济变革的技术'。Pachocki在一次采访中表示,这些工具可能彻底改变多个行业,但这基于的是一个'快速推进的假设'。例如,以Elon Musk为例——这位特斯拉首席执行官和SpaceX创始人曾多次提到AI的潜在风险与机遇,他引用类似meme来强调AI如何像火箭般飞速发展至火星之旅(Step 3),却避免讨论具体的实现路径。Musk的观点是,如果现在不投资AI技术,未来将错失机遇;但Pause AI的成员则警告说,盲目的乐观可能掩盖真实问题。
AI不是仅仅停留在想法中的理论,这是一个现实世界的应用话题。许多行业分析显示,从软件开发到金融服务,AI正被大力吹捧为下一个颠覆者。但具体数据却揭示出很大差距:一项来自Anthropic(一家AI研究公司)的最新预测分析了大型语言模型(LLMs)对劳动力的影响。Anthropic的研究团队基于现有AI工具的表现,推断出哪些职业最可能被改变——如管理人员、建筑师或媒体工作者应准备好转型,因为这些角色涉及战略思维等AI擅长的任务。相反,那些从事体力劳动或常规操作的岗位——比如场地维护者、建筑工人——受影响较小,除非AI能接管这些领域。
然而,另一个在2024年2月发布的独立研究挑战了这种简化假设。这是一项由MERCOR(一家AI招聘初创公司?等一下,资料显示是Mercor AI或类似实体)的研究人员进行的实验:他们测试了多种AI代理(包括那些基于OpenAI、Anthropic或Google DeepMind顶级模型的系统)在480个常见银行家任务中的表现,比如数据分析、客户咨询或法律评估。结果令人意外:几乎所有AI代理都无法完成大多数职责,失败率高达90%以上;仅少数简单任务略有效果。这表明AI在现实职场中的局限性不仅仅在于理论,而是实际操作能力的缺失。
为什么会有如此大的分歧?原因在于研究者和行业参与者往往忽略AI的实际部署过程。Anthropic的研究是基于LLMs的理论性能——例如,在处理文本任务时,这些模型确实能高效完成许多自动工作。但MERCOR的研究显示,在真实环境中(如职场),AI工具需要与人类结合,而非简单替换。想象一下:在银行场景中,添加AI代理时,员工必须适应新工作流程,有时反而导致效率下降或错误增加。这不是说AI毫无价值;事实上,许多专家认为它能提升生产力——但这需要通过证据而非猜测来确认。
更深层的原因是缺乏共识,尤其是在谁应该定义Step 2方面。Pause AI的成员强调,AI发展应优先考虑安全和伦理监管;例如,在人工智能领域中,像欧盟正在讨论的AI法案(Artificial Intelligence Act)可能提供框架来规范第二步行动。相反,乐观者如DeepMind或OpenAI的投资者,常常专注于技术突破而非潜在风险。他们认为,如果公司能像谷歌那样投资AI代理开发,就能快速实现变革;但历史表明,许多政策倡议失败是因为中间步骤未被充分考虑——正如那个经典的underpants gnome策略所揭示的。
总之,AI领域正经历一项狂热的炒作浪潮:从收集数据到承诺利润(Step 1-3),但真实证据显示中间环节模糊不清。这提醒我们,作为负责任的新闻报道者,我们需要更多基于实证的信息而非简单猜测。行业应该推动透明度——例如,在AI招聘或工具开发中分享更多测试数据——来协调从研究到应用的过渡。未来不确定,但AI可能作为经济黑箱被重新定义——就像underpants gnome策略所satirize的一切从简化到复杂。 {