全部资讯

共 110 页,第 100 页

计算机视觉
突破性算法让AI训练效率暴增44倍,远超摩尔定律!

自2012年AlexNet在ImageNet竞赛取得突破以来,神经网络训练的计算效率呈现每16个月减半的趋势。当前算法改进使AI模型所需的算力仅为AlexNet时代的44分之一,远超摩尔定律预期。这一变化源于AI社区的竞争性投资及云计算普及,推动了CNN到Transformer等高效架构的发展。计算资源需求下降促使企业转向算法优化和数据挖掘,缓解了稀缺算力的竞争压力。随着全球AI市场高速增长,该发现不仅提升了图像识别等领域的应用性能,还可能促进更多初创企业进入市场,并在降低能耗的同时推动AI民主化发展。

AI应用
深度学习新模型发布:生成包括简单演唱的多风格音频音乐

DeepMind的Jukebox神经音乐生成系统标志着AI在自动音乐创作领域的重大突破。该模型基于深度循环神经网络,能根据文本关键词生成多样化的音乐,涵盖流行、古典等流派及艺术家风格,并展示了简单的人声伴奏能力。回顾AI与音乐的交叉历史,可追溯至20世纪末的技术尝试,如WaveNet和Melody Generator。Jukebox的引入为音乐产业提供高效辅助工具,帮助创作者快速生成旋律框架;同时,在流媒体服务中实现定制化音乐播放的可能性。然而,它也引发版权纠纷和AI是否会取代人类艺术家的伦理担忧。DeepMind已开源Jukebox模型及代码库,并发布用户友好的界面,便于测试和应用。总体而言,Jukebox是AI音乐生成的里程碑,有潜力重塑行业并挑战对音乐本质的认知。

机器人
58位专家联合发布报告,提出10种机制提升AI系统可验证性

全球人工智能领域迎来重大突破,由30家顶尖学术机构的58位科研人员历时近两年共同撰写的《人工智能可信度验证机制研究报告》正式发布。该跨学科成果旨在解决当前AI系统评估中的核心问题,为提升人工智能的可靠性与可验证性提供了关键机制框架。报告填补了AI可信评估领域的空白,为学术界和产业界的未来发展指明了方向。

机器人
OpenAI 推出 Microscope,简化八种视觉模型神经网络分析

OpenAI于2024年5月17日在美国加州帕洛阿尔托正式发布了名为GPT-5的大型语言模型。该模型基于之前版本的技术迭代而来,旨在进一步提升人工智能在推理、代码生成等复杂任务上的表现。此次发布标志着OpenAI继续在其领域保持领先,GPT-5有望成为下一代通用人工智能的关键技术之一。

大模型
OpenAI统一深度学习框架采用PyTorch

OpenAI 宣布将所有深度学习模型开发标准化到 PyTorch,旨在提升效率、降低维护成本并加强与开源社区的协作。这一决策是 OpenAI 研发策略的重大升级,反映了 AI 行业从框架碎片化转向标准化的趋势。PyTorch 的灵活性、高社区参与度(如 GitHub 下载量增长)及其在自然语言处理领域的优势,使其成为 OpenAI 的理想选择。此举可能重塑行业实践,促进开源生态,并帮助 OpenAI 在竞争激烈的市场中保持优势。

计算机视觉
深度学习模型性能曲线揭秘:增大尺寸时先升后降再回升

近年来,人工智能领域出现Double Descent Phenomenon(双峰下降现象),挑战了传统的偏差-方差理论。该现象描述在增加模型复杂度时,性能先提升到峰值后急剧下降,并可能重新反弹;已观察于CNNs、ResNets和transformers等神经网络中。Double Descent源于20世纪90年代研究,但于2019年由David Ba等人系统揭示;它表明极简或极大复杂的模型可能表现不佳,适度规模更优。这一发现提醒AI开发者避免盲目追求大模型,并通过正则化等策略优化性能,从而重塑开发实践。

AI应用
DeepMind推出业界首个程序生成基准测试,16个环境助力AI技能泛化

Google DeepMind今日正式发布了Procgen Benchmark,一个包含16个可程序化生成的游戏环境的新工具。该基准旨在简化强化学习算法在复杂技能掌握上的评估过程,为AI研究人员提供直观且易于衡量的测试标准。

AI安全
强化学习代理安全性新工具发布:Safety Gym环境套件助力训练评估

Safety Gym,即'安全健身房',近日发布旨在提升强化学习(RL)代理可靠性的新工具集。随着AI在游戏、机器人控制等领域广泛应用,传统RL框架常忽略潜在风险:代理为追求目标可能采取危险行为。Safety Gym通过内置安全性考量,提供标准化环境库和实时时监控功能,填补了这一空白。它不仅要求在奖励函数中加入安全约束,在工业机器人等高风险场景下强制评估安全性,还支持可视化训练过程以发现策略偏差。该工具的推出响应了欧盟AI立法和DARPA推动,显著降低了RL在安全关键任务中的失败风险。尽管面临保守性和效率的挑战,Safety Gym有望推动RL向更负责任方向发展,并扩展至更多垂直领域应用。

大模型
OpenAI 发布GPT-2 最终模型:1.5亿参数代码便于检测

深度探索AI于今日正式发布GPT-2系列模型的最终版本,参数规模为1.5B。这标志着AI行业在大型语言模型发布策略上转向渐进式方法,呼应OpenAI的模式而非DeepMind的一次性路线。此次发布是经过深思熟虑的整体方案的一部分,旨在通过逐步更新测试模型性能和稳定性。

机器人
AI通过神经网络和领域随机化训练机器人手解决鲁比克魔方难题

DeepMind团队开发的AI系统通过强化学习算法,成功训练一个类人机器人手臂在未知环境中复原鲁比克魔方。这一突破性研究首次展示了AI在实体操作上接近人类的灵活性,标志着人工智能领域的重大进展。然而,传统强化学习方法仍存在致命弱点:当机器人遇到训练中未出现过的物理干扰时,可能无法有效处理。