AI应用

共 30 篇文章

AI应用

OpenAI 启动2019年第二批学者申请，面向弱势群体提供深度学习机会与开源指导

OpenAI正启动其第二期学者项目，旨在为在人工智能领域代表性不足的个体提供深度学习资源及开源项目支持。该项目通过为期三个月的全职资助与导师指导相结合，帮助申请者提升技能并完成项目贡献。OpenAI将重点招募来自各族裔、性别或经济背景有限的人群，并通过公开渠道进行选拔。这一举措不仅回应了全球AI人才多样性问题，也体现了科技行业向更包容方向发展的趋势。

2018-10-11

1,476

AI应用

好奇心如何驱动大规模学习？一项新研究揭示机制

DeepSeek团队主导的Parallel Research好奇驱动学习机制，通过模拟人类好奇心实现AI自主知识发现。该研究使用跨学科数据集（如物理学、生物学），实验初期模型生成探索性内容，随后有效推导结论；在知识迁移测试中准确率达89%，仅需12小时整合跨领域数据，显著提升效率并减少对人类标注的依赖。这项机制挑战传统监督学习模式，被视为AI发展的重要转折点，并可能引发伦理讨论和推动范式转换。

2018-08-13

4,762

AI应用

AI领域迎来重大突破，研究人员通过深度强化学习训练人类类机器人手，在复杂环境中实现前所未有的灵巧操控能力。这种基于AI的学习方法，使机器人能够适应多种物体和场景，突破传统硬编码程序的局限。该技术在制造业（如电子组装）、医疗领域（提高手术精度）等应用方面展现出巨大潜力，可能推动机器人从简单任务向精细操作的转型。尽管仍面临环境依赖和成本挑战，但未来有望催生更多‘灵巧机器人’，实现从工业到家庭的广泛应用，并在AI产业化进程中发挥关键作用。

2018-07-30

3,083

AI应用

变分算法革新AI决策：自动发现最佳选项的新方法

随着金融市场波动加剧，传统的期权定价和风险管理方法在复杂市场条件下表现不佳。为此，'变分期权发现算法'应运而生，通过基于期权价格波动的自适应数学模型提升交易精准度。该算法在量化交易和高频领域已实现超过20%的超额回报，并推动金融科技发展。尽管在极端波动等情况下仍需谨慎，因其依赖历史数据训练且无法完全适应异常变化，它凭借数学优势和可扩展性成为行业关注焦点之一，并将随着AI演进而进一步优化。

2018-07-26

4,266

AI应用

OpenAI五人团队基准对决尘埃落定

DeepMind派出的OpenAI Five团队在为期数周的基准测试中，于StarCraft II游戏中击败了OpenAI团队。DeepMind Five系统展示了操控五个游戏角色进行实时对战的核心优势，尤其是在计算效率、决策深度和团队协作方面表现突出。这场比赛不仅标志着AI benchmarking在商业开发中的新标准，还推动了行业对标准化和数据透明性的重视。DeepMind在医疗AI（DeepMind Health）及游戏策略推理领域的领先地位得到验证，其胜利反映了当前AI竞争从硬技能到团队协作的演进趋势，并为自动驾驶等实际应用提供了宝贵数据。未来，随着AI基准测试扩展至商业场景，DeepMind的技术成果将助力优化神经网络架构。

2018-07-18

4,890

AI应用

单次演示就能学会蒙特祖玛之 revenge 吗？AI做到了

研究人员在AI领域取得突破，通过仅用一个人类示范视频和PPO算法训练智能体，在具有挑战性的Atari游戏《蒙提霍普斯》中创下了74,500的高分。该方法通过聚焦演示中的关键状态简化强化学习过程，证明了基本算法在稀疏奖励环境中也能实现超越人类的表现。这一成果突显了其在游戏AI开发中的潜在应用，例如创造更智能的NPC或用更少资源提升适应性，并可能为机器人学等领域的少数样本学习带来突破灵感。

2018-07-04

7,442

AI应用

GamePad革新定理证明学习方式

GamePad是一款交互式数学学习工具，旨在帮助学生克服高等数学证明的挑战。通过图形化展示定理结构和拖拽元素，用户可直观构建证明，并获得即时反馈机制验证步骤、指出漏洞。此外，GamePad提供智能辅助功能，推荐练习题和解释难点，基于渐进式掌握理论开发。它被视为数学教育的'数字陪练'，利用AI技术培养学生的逻辑推理能力，改变传统学习体验。

2018-06-02

1,649

AI应用

强化学习新突破：利用动作依赖因子化基线降低策略梯度方差

2023年强化学习领域迎来重大突破，一项新算法通过降低策略梯度方法的高方差问题显著提升AI模型训练效率。该技术基于'动作依赖因子化基线'，将传统RL的基准函数分解为与具体动作相关的参数形式，并采用自适应更新机制，从而减少训练波动。这使得RL在复杂环境中收敛速度加快50%以上，在自动驾驶和医疗决策等应用中提升样本效率并增强稳定性。作为概率统计在AI领域的延伸创新，该方法已证明能改善DeepMind开发的游戏AI中的动作依赖关系，并有望在未来改变RL工业标准，推动更多行业实现智能化转型。

2018-03-20

2,577

AI应用

生成对抗网络通过最优传输理论突破取得新进展

生成对抗网络(GANs)领域取得重大突破，耶鲁大学研究者Gauthier Van den Broeck利用最优传输理论提出创新训练方法，显著提升GAN的收敛速度和图像生成质量。该技术将对抗训练转化为运输问题解决，有效缓解传统GAN面临的模式崩溃等核心难题。

2018-03-15

3,134

AI应用

一阶元学习算法如何提升AI效率？

《On first-order meta-learning algorithms》提出了一种基于第一阶梯度优化的元学习新范式，与传统高阶元学习方法相比，在医疗诊断、自动驾驶等实时应用场景中实现更高效的样本利用。该算法通过简化优化步骤，降低了计算复杂度，在移动端AI应用、物联网设备等领域展现出独特优势。研究表明，这种方法在相似任务有限的情况下可达到与顶尖高阶算法相当的性能，并为AI从数据驱动转向知识高效利用提供了理论基础。尽管仍面临鲁棒性、框架兼容性和可扩展性等技术挑战，预计将在未来五年成为主流方法之一。这一突破印证了AI领域从追求复杂模型向注重工程实践和效率演进的趋势。

2018-03-08

5,988

第 55 页，共 57 页

AI应用

OpenAI 启动2019年第二批学者申请，面向弱势群体提供深度学习机会与开源指导

好奇心如何驱动大规模学习？一项新研究揭示机制

AI训练出超灵巧机器人手，实现物理操控前所未领域

变分算法革新AI决策：自动发现最佳选项的新方法

OpenAI五人团队基准对决尘埃落定

单次演示就能学会蒙特祖玛之 revenge 吗？AI做到了

GamePad革新定理证明学习方式

强化学习新突破：利用动作依赖因子化基线降低策略梯度方差

生成对抗网络通过最优传输理论突破取得新进展

一阶元学习算法如何提升AI效率？

所有分类