Founder Park - 财报，业绩电话会，研报，新闻

Founder Park

搜索文档

AdventureX 2025招募开启：5天时间，用AI做点东西，改变世界一点点

Founder Park· 2025-04-17 20:12

以下文章来源于AdventureX ，作者激动地上蹦下跳的 AdventureX . 让更多中国年轻人为改变世界而活 47 此图片来自微信公众平台未经究许不可引用此图片来自微信公众平台未经允许不可引用编者荐语： Founder Park 作为合作方，强烈推荐 26 岁以上的创业者也来参与：你不是来讲故事的，你是来重新做事的。真正的经验，是用来被年轻人挑战的。最好的 Mentor 不是站在讲台上，而是坐在地板上和年轻人一起吃泡面、Debug、吵架、构建的那个人。此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未经允许不可引用 4 此图片来自微信公众平台此图片来自微信公众平台未经允许不可引用 ■ ■ � P t P ■ 此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未经允许不可引用此图片来自微信公众平台未 ...

OpenAI科学家姚顺雨：o3发布、RL迎来新范式，AI正式进入下半场

Founder Park· 2025-04-17 20:12

AI发展阶段的划分 - AI发展进入下半场，核心从训练方法创新转向问题定义和评估体系重构 [1][5] - 上半场的标志性成果包括DeepBlue、AlphaGo、GPT-4等，均依赖训练方法突破 [2][6] - 下半场的关键转变在于强化学习(RL)泛化能力突破，实现跨领域任务统一解决 [3][13] 上半场的特征与局限 - 最具影响力的AI论文集中于训练方法创新，如Transformer(16万次引用)远超其基准WMT'14(1300次) [8][10] - 训练方法创新具有跨领域通用性，例如Transformer同时推动CV、NLP、RL发展 [11] - 局限性在于过度简化评估环境，导致算法与现实需求脱节 [19][21] 有效配方(Recipe)的构成 - 核心要素包括：大规模语言预训练、算力数据扩展、推理与行动结合 [14] - 传统RL三要素中，先验知识(priors)重要性被低估，语言预训练成为泛化关键 [22][29] - OpenAI实践显示环境设计优先级需提升，Gym/Universe项目验证环境复杂性需求 [21] 下半场的范式转变 - 评估体系需重构，挑战自动运行、独立同分布(i.i.d.)等传统假设 [38][41] - 新游戏规则要求开发面向现实效用的评估设定，突破渐进式改进局限 [33][41] - 典型案例包括Chatbot Arena引入真人交互、tau-bench采用用户模拟 [38] 技术突破的具体表现 - ReAct框架实现语言推理与行动协同，成为Agent领域基础架构 [27][28] - GPT系列通过预训练注入先验知识，解决WebGPT/ChatGPT等现实任务 [21][22] - o系列模型展现跨任务泛化能力，特定任务优化边际效益递减 [33] 行业影响与未来方向 - 头部实验室资源向RL环境设计倾斜，算法创新优先级下降 [1][29] - 效用问题(Utility Problem)成为核心挑战，需建立与经济价值挂钩的评估标准 [36][37] - 产品化能力成为竞争焦点，成功案例可能催生万亿级企业 [41][42]