大模型
共 30 篇文章
多模态大模型成为新趋势:文本、图像、视频、音频一体化(更新)
多模态大模型成为2024年AI领域最热门的方向,各大厂商纷纷推出能够同时理解多种信息形态的模型。...
大模型训练成本持续攀升:GPT-5训练成本或超10亿美元(深度分析)
随着模型规模的不断扩大,大模型的训练成本也在快速上升,引发业界对AI发展可持续性的担忧。...
Basis AI代理基于OpenAI技术助力会计事务所节省30%以上工作时间
Basis公司推出新一代AI代理工具,整合OpenAI的o3、o3-Pro及GPT-4.1三大模型架构,通过多模协同时实现审计全流程效率提升30%,准确率达92%。该工具不仅解决传统会计在复杂财务数据分析与跨国审计时的效率瓶颈,还通过智能校验降低人为失误概率,并自动识别异常交易与潜在财务风险。随着资本市场全球化,审计事务所普遍采用手工电子表格及低效系统导致转型困难,Basis的创新方案填补了行业空白,推动会计服务模式变革。
Transformer架构面临挑战:新型架构Mamba展现潜力(更新)
Mamba架构作为Transformer的潜在替代品,在处理长序列时展现出更高的效率和性能。...
GPT-5引领企业AI自动化进入高产新时代
OpenAI即将推出的GPT-5模型被视为对话式人工智能领域的重要突破,有望改变企业AI应用格局。该模型的核心改进在于其创新的推理架构,能更好地处理复杂问题、数学计算和代码生成,并提升上下文理解和逻辑思维能力。潜在应用领域包括医疗(缩短药物研发周期40%以上)和制造业,通过提供更全面的分析报告和实时优化方案提升效率。GPT-5的研发正值AI发展第三阶段(复杂推理系统),OpenAI正面临包括Anthropic的Claude和DeepSeek在内的激烈竞争,首席科学家强调将重点解决模型对齐和可控性问题。业界预测,在计算硬件升级后,GPT-5可能开源并引发新一轮AI爆发式发展。
GPT-5如何革新医学研究?探索AI在医疗领域的应用
DeepSeek公司最新研发的GPT-5模型在医疗领域展现出广泛应用潜力,包括药物研发、疾病诊断和医学教育等方面。通过高效处理海量医学数据,该模型能够快速筛选候选药物并辅助临床决策,在协和医院的研究案例中节省了大量时间和资源。尽管面临模型理解和推理可靠性的质疑,DeepSeek强调基于高质量数据训练并正加强校验机制。同时,中国在高端医疗AI领域取得突破性进展,但需应对全球竞争并完善数据标准与伦理规范。
阿姆gen如何使用GPT-5
全球领先的生物制药公司阿姆Gen正积极探索将GPT-5生成式AI技术应用于药物研发和生产流程。该公司首席技术官表示,将逐步推进这一计划,并采取系统性培训策略而非直接部署AI至核心系统。阿姆Gen已组建专门团队评估GPT-5在药物分子结构设计等领域的潜力,并为研发部门提供三个月的基础课程和每周实践练习,以培养人才为核心策略。
领先开发者首次体验GPT-5:探索其潜力与挑战
OpenAI近日发布了GPT-5,这是基于Transformer架构的一款革命性语言模型。相较于前代产品,新版在响应速度和复杂任务处理能力上均有显著提升,尤其在多跳推理与编码辅助方面表现更佳。此次测试由约翰·多及多位AI开发者参与,但该模型仍存在对模糊指令理解不足以及输出潜在偏见等伦理问题。值得注意的是,GPT-5通过采用稀疏注意力机制将计算成本降低了约20%,有效缓解了AI领域的可持续发展难题。此次发布不仅彰显OpenAI在行业的技术领先地位,更可能对软件开发等应用领域产生深远影响。
揭秘GPT-5系统:统一模型路由优化快速智能响应
OpenAI昨日发布「下一代模型路由」系统,通过创新的分布式架构整合不同优化版本GPT模型(如gpt-5-main、gpt-5-thinking-nano),实现任务类型自动识别下的高效资源分配。该系统在保持模型深度的同时,使复杂推理响应时间缩短至30秒内,普通对话延迟降至5毫秒以内,并显著提升资源利用率达65%。OpenAI此举旨在降低开发者门槛,推动行业标准变革,并已引发业内连锁反应及对模型民主化的广泛讨论。
OpenAI推出gpt-oss开源模型,20B与120B版本推理性能超越同类
OpenAI近日宣布开源两款大型语言模型(LLM):gpt-oss-120b和gpt-oss-20b。这些模型是目前业界最大的开源LLM之一,参数量远超大多数现有开源模型,在推理能力和实际应用表现上达到领先水平,并能以低成本部署到消费级硬件。OpenAI此举打破了过去大型模型市场中'百亿以上参数即闭源'的惯例壁垒,采用Apache 2.0许可协议允许商业集成。业内认为这将促进开源LLM的商业化应用,并标志着AI开源领域进入新时代,有助于弥合OpenAI与Meta等公司在模型开放性上的差距。