大模型
共 30 篇文章
谷歌Gemini Ultra在多项测试中超越GPT-4(更新)
谷歌最新发布的Gemini Ultra模型在多项基准测试中取得了领先成绩,特别是在多模态理解和代码生成方面。...
国产大模型集体爆发:文心一言4.0、通义千问2.0相继发布(深度分析)
百度文心一言4.0和阿里通义千问2.0相继发布,国产大模型在中文理解、多模态能力等方面取得重大突破。...
AMD与OpenAI签署多年合作协议,部署6吉瓦GPU以加速全球AI创新
AMD宣布将于2024年6月13日起与OpenAI建立为期数年的战略合作伙伴关系,提供总计6GW的GPU算力芯片。核心产品为Instinct MI300系列,采用CDNA 3架构,在相同能耗下运算能力提升30%,显存带宽提高50%。该合作将从2026年开始分三阶段实施:首年部署1GW,至2028年扩展到3GW,并逐步达到6GW总容量。OpenAI将利用这批算力训练下一代大型语言模型,如GPT-5,并解决分布式计算中的性能瓶颈问题。此次合作标志着AMD在AI算力市场正式回归,过去三年英伟达凭借CUDA生态系统占据了近80%市场份额。预计这一项目将创造超过2000个就业岗位,并推动AI行业标准演进,同时可能促使英伟达加快下一代GPU研发和AMD优化其X86处理器的AI支持。然而,OpenAI仍需克服数据迁移、硬件适配等技术挑战,并在2024年底前完成过渡。该项目覆盖OpenAI在全球的关键数据中心节点,将构建全球最大的分布式GPU计算网络之一,并可能促进开放标准的数据中心架构发展。
三星与SK加入OpenAI星门计划,扩大全球AI基础设施投资
OpenAI于2024年1月宣布Stargate计划引入三星电子和SK海力士作为战略合作伙伴,旨在构建更强大的全球算力网络支持AI发展。三星和SK将投入数百亿美元建设数据中心,并提供尖端AI芯片及定制化计算架构。此次合作使OpenAI的数据中心伙伴增至全球四大半导体巨头:三星、SK海力士、美光与英特尔。双方合作不仅提升了OpenAI的算力弹性,也体现了半导体行业在AI时代的激烈竞争与技术布局。
Claude 3 Opus发布:Anthropic挑战GPT-4(更新)
Anthropic公司发布了Claude 3系列模型,其中Opus版本在多项任务中展现出与GPT-4相媲美甚至更优的性能。...
新GPT模型亮相:专为编程优化的智能助手,复杂任务不再难
OpenAI 推出了名为 GPT-5-Codex 的新编程工具,该模型基于先进的语言处理技术,能够自动化代码生成和优化,有望彻底改变软件开发的方式。这一发布被视为 AI 在开发领域的又一突破性进展,强调了其潜力在简化复杂编程任务。
OpenAI与微软签署新MOU,强化人工智能安全合作
2024年3月15日,微软与OpenAI在美国加州总部签署新合作协议。业界普遍认为此次合作将重点聚焦于计算资源的高效分配,以及在全球AI监管日益严格背景下提升技术安全性。此前微软已投资OpenAI并与其在算力支持方面展开深度合作;随着xAI项目和DeepSeek等新参与者崛起,微软作为OpenAI最大股东需重新平衡战略。此协议被视为科技巨头应对全球模型监管挑战的'合规型'合作典范,不仅有助于两家公司在AI发展竞争中保持优势,也可能为其他AI企业跨国合规合作提供参考框架。
国产大模型集体爆发:文心一言4.0、通义千问2.0相继发布(更新)
百度文心一言4.0和阿里通义千问2.0相继发布,国产大模型在中文理解、多模态能力等方面取得重大突破。...
AI模型GPT-4b微助力OpenAI与Retro Bio研发高效蛋白质
OpenAI与生物创新公司Retro Bio合作,利用名为'GPT-4b micro'的AI技术成功设计出具有特定功能的新蛋白质分子序列,为衰老机制研究和干细胞疗法开辟了全新路径。此前DeepMind的AlphaFold模型在蛋白质结构预测领域取得突破,但Retro的研究展示了AI直接生成新蛋白的能力,展现出更激进的应用方式。
Transformer架构面临挑战:新型架构Mamba展现潜力(深度分析)
Mamba架构作为Transformer的潜在替代品,在处理长序列时展现出更高的效率和性能。...