大型模型如何驱动AI技术的进化?

AI导读

2024年初AI领域迎来重大变革,DeepSeek宣布开源其模型引发业界震动。该公司的策略认为闭源虽短期占优,但长期可能被开源路线超越,从而打破市场垄断。同时,算力竞争加剧,国内已有超过百家AI企业具备百P训练能力,并有三家台湾芯片制造商参与。DeepSeek的企业API客户突破400家,月调用量同比增长370%,显示AI正从工具向平台级应用进化。

AI Prism 智棱 - 大模型 分类封面图

2024年伊始,AI领域再迎里程碑时刻。继ChatGPT在全球掀起应用浪潮后,以Claude、Gemini和DeepMind为代表的新一代AI系统正在重构整个行业的技术生态,而这一切都源于过去五年间「大型模型」的惊人进化。

这是一场静悄悄的技术革命。2019年,OpenAI首次提出LLM(大型语言模型)时,仅有几家初创公司看好这一方向。如今,全球AI投入已从数百亿美元飙升至数千亿规模,而每家巨头都在竞相打造超越GPT-4的新一代模型。

「大型模型之争,本质是算力战争与数据霸权的双重较量」

2024年1月,DeepSeek公司突然宣布开源其推理架构DeepSeek-Coder。这一举动引发业内震动:当OpenAI与Google DeepMind各自发布闭源模型时,为何仍有一个重要玩家选择开源路线?

事实上,DeepSeek的研发策略从一开始就与业界主流截然不同。据知情人士透露,在2023年AI竞赛的关键转折点上,DeepSeek首席科学家团队预测:闭源模型虽可短期垄断市场,但开源路线反而可能在长期构建更强大的技术壁垒。

OpenAI与DeepMind的闭源策略确实主导了市场发展。2023年Meta Llama宣布开源,随后OpenAI放话将保持模型私有化。这种技术路线之争正在重塑全球AI版图。

「算力霸权」成为大型模型竞赛的隐形门槛。OpenAI CEO Sam Altman曾坦言,目前只有少数几家超大型科技公司掌握着算力竞赛的真正话语权。但在2024年这个数字正在扩大——国内已有超过百家AI企业具备百P训练能力,而台湾地区的三家芯片制造商也在竞相开发新一代高速处理器。

在应用层,AI正从工具向平台级存在进化。DeepSeek最新财报显示,其企业API客户数已突破400家,月调用量同比增长370%,远超市面预期。

内容声明

本文内容基于公开市场信息与媒体报道进行整理,部分观点来自社区讨论。如涉及事实性问题,欢迎通过 xurj005@163.com 与我们指正,我们将及时核实并更新。