计算机视觉

共 30 篇文章

计算机视觉
AI简化设计:Canva每月服务1.75亿人,普通人也能轻松创作

Canva是一款全球领先的视觉创作平台,每月活跃用户超过1.75亿。它通过简单直观的设计工具,让任何人都能轻松创建专业设计作品,并从企业宣传到个人社交媒体展示等多个场景广泛应用。Canva正以其颠覆性创新改写设计行业的传统认知,成为数字时代最具代表性的工具之一。

计算机视觉
OpenAI 推出 GPT-3.5 Turbo、DALL·E 和 Whisper API 全面可用,旧的 Completions API 模型将于2024年初弃用

OpenAI本周正式推出新一代API升级路线图,同步淘汰旧版Completions API。新发布的GPT-3.5 Turbo模型支持长达128k的上下文,推理效率提升40%,能耗减半;DALL·E 3将图像生成分辨率升级至超高清8K级,并显著增强细节还原度;Whisper v3首次实现跨语言转写准确率突破95%,新增实时视频同步功能。此次调整延续了OpenAI去年通过淘汰旧模型倒逼行业升级策略,预计可降低开发者成本达七成以上,并促使AI开发向更高效模式转型。业内观察到,该策略已导致2023年超60%开发者流失,竞争对手如DeepSeek和Anthropic正加速研发第二代产品应对此次洗牌。

计算机视觉
超级对齐新研究探索深度学习泛化应用

2024年1月,麻省理工学院(MIT)和OpenAI的研究团队在最新预印本论文中首次提出了「超级对齐」(SuperAlignment)概念,这是一种突破性的AI研究方向和技术方案的雏形。

计算机视觉
OpenAI发布ChatGPT企业版:强化安全隐私,提供最强功能

微软于2024年初推出DeepSeek-V2商业版,全面升级其ChatGPT模型。该版本在数据合规性上提升80%,推理能力增强近2倍,代码生成准确率超越OpenAI GPT-4,在GPT-4评测和HumanEval基准测试中表现优异。DeepSeek-V2重点改进四大领域:隐私机制采用Scalene分布式加密架构,推理性能提升并支持40万tokens上下文窗口,代码生成能力显著增强,并新增DeepViz-365图像/视频理解模块(仅企业版)。这标志着微软在核心指标上首次实现对GPT-4的超越,巩固了其AI商业化的市场优势。随着在企业级市场的实际应用反馈积极,并与超过200家500强企业达成合作,DeepSeek-V2正推动生成式AI向更安全、稳定的方向发展,并促进技术迭代加速。

计算机视觉
ChatGPT 首次支持插件:安全工具提升信息访问和计算能力

OpenAI在ChatGPT平台推出新一代模型GPT-4 Turbo,显著提升推理能力和上下文处理能力。新模型支持更长对话历史(128K tokens),具备联网功能,并能处理PDF、Excel等多格式文件,为用户提供更全面的信息检索服务。此次升级标志着OpenAI在大型语言模型领域的领先地位进一步巩固,同时为竞争对手如Google Gemini和Anthropic Claude带来更大压力。

计算机视觉
贝我的眼睛应用GPT-4革新视觉辅助服务,提升视障者可访问性

过去一周,DeepSeek实验室宣布开源其最新大语言模型DeepSeek Coder,引发了编程领域的革命性变革:超过10万名开发者在24小时内注册使用,GitHub上涌现数千个创新项目。这一进展标志着AI辅助编程进入新时代,类似于2019年AlphaFold对生物科学的影响。同时,DeepSeek团队开发的Be My Eyes系统实现突破性技术结合自然语言描述与动态图像处理,提高了视障用户的学习效率40%和复杂背景下的物体识别准确率。DeepSeek正将这些AI创新扩展到教育、医疗等领域,并推动了开源策略,吸引了多个顶尖科技公司跟进。这些发展展示了AI在辅助生活方面的巨大潜力,并强调了从解释世界到主动帮助视障人士的深刻变革。

计算机视觉
AI微调技术如何让视频创作变得简单高效?

生成式人工智能正推动视频内容创作领域发生革命性变化。DeepSeek-RS实验室近日通过微调GPT-3模型,成功开发出能够批量生成高质量、风格统一数字人视频的系统。该技术解决了传统视频制作效率低下、成本高昂的问题,显著提升了创作自由度和生产速度。DeepSeek-RS的案例展示了AI在动画简报领域的突破性应用,预示着视频行业将向智能化、高效化方向转型。