Workflow
AI下半场
icon
搜索文档
27岁掌舵腾讯大模型,非典型天才定义AI下半场
搜狐财经· 2025-12-24 01:06
公司核心人事动态 - 姚顺雨于2025年出任腾讯首席AI科学家 同时兼任AI Infra部及大语言模型部负责人 掌舵公司AI基础设施与大模型研发的核心业务[1] - 姚顺雨于2024年加入OpenAI 担任研究科学家 专注于将大型语言模型从理论研究推向实际应用 主导开发了OpenAI首个发布的智能体模型及产品 同时参与了Deep Research项目[1][10] - 姚顺雨的加入与腾讯近期优化人工智能战略布局相契合 公司新成立了AI Infra部、AI Data部、数据计算平台部 以全面强化其大模型的研发体系与核心能力[11] 行业技术趋势与个人研究重点 - 姚顺雨认为AI的下半场已经来临 评价会比训练更重要 研究者应将重心从“解决问题”转向“定义问题” 像产品经理那样思考[12] - 其研究核心关键词为“智能体” 认为语言是实现通用智能体的“先天圣体” 因为语言天然携带推理基因 能够跨环境迁移[7] - 在技术路径上 其早期认为计算机视觉难实现通用智能 转而专攻语言方向 并选择GPT而非当时主流的BERT作为研究基础 因其更符合开放行为空间决策的需求[4][8] - 其提出的ReAct方法已成为世界范围内构建语言智能体的最主流方法 该方法核心理念是让大语言模型在行动前先进行可解释的内在推理 继而基于推理结论去决策与操作[9] - 其研究追求“简单且通用”的方法 希望找到能泛化到多任务的简单解法 并认为有必要将多模态能力纳入语言智能体框架中[10] 个人背景与职业轨迹 - 姚顺雨于2015年以安徽省理科第三名成绩考入清华大学交叉信息研究院“姚班” 2019年赴美国普林斯顿大学深造 专攻自然语言处理与强化学习[1] - 其在普林斯顿大学与副教授卡提克·纳拉辛汉合作 后者是GPT-1论文的第二作者 他们共同探索利用GPT-2等强大模型进行复杂语言游戏训练 以研究智能体的新可能性[4][5] - 其曾以最年轻入选者身份跻身《麻省理工科技评论》“35岁以下科技创新35人”中国区名单[3]
腾讯AI,大消息!
证券时报· 2025-12-18 12:56
腾讯AI战略与组织架构升级 - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化大模型研发体系与核心能力 [1] - 前OpenAI研究员、顶尖AI人才姚顺雨加入腾讯,出任首席AI科学家,并向总裁刘炽平汇报,同时兼任AI Infra部及大语言模型部负责人 [1] - 架构升级旨在提升AI大模型研究能力,聚焦公司AI战略布局,提升研发效率,并进一步强化腾讯在工程化方面的优势 [4] 核心人才姚顺雨及其行业观点 - 姚顺雨现年27岁,为AI领域顶尖新锐人才,拥有清华大学姚班及普林斯顿大学背景,曾为OpenAI核心成员,并入选《麻省理工科技评论》TR35 [2] - 其提出的“AI下半场”理论指出,行业竞争重心将从拼模型训练、比参数规模转向真实场景的价值定义、交互体验优化和评估体系构建,核心逻辑是“评估比训练更重要” [2] - 姚顺雨认为AI下半场将从“解决问题”转向“定义问题”,取得成功需要调整思维模式和技能组合,使其更接近产品经理的能力模型 [3] - 其研究聚焦于让AI通过语言和推理能力成为解决广泛现实问题的工具,这也是其被行业寄予厚望的核心原因 [3] 腾讯AI技术进展与产品落地 - 过去一年,腾讯混元大模型发布了超过30个新模型 [4] - 12月5日发布的混元2.0显著改进了预训练数据和强化学习策略,在复杂推理与文本生成场景表现国内领先 [4] - 混元3D模型保持全球领先水准,开源社区下载量超过300万 [4] - 腾讯元宝AI应用用户规模稳居国内前三,上线初期保持每天一个版本的迭代频率,其AI能力已融入微信、QQ、音乐、会议等国民级产品 [5] 腾讯内部AI化应用与效率变革 - 腾讯混元大模型已在公司内部超过900款应用和场景中落地,包括腾讯会议、微信、广告、游戏等 [5] - 在腾讯公司内部,有超过90%的工程师在使用腾讯云代码助手CodeBuddy,50%的新增代码由AI辅助生成,代码评审环节AI参与度达到94% [5]
腾讯AI大消息!
证券时报· 2025-12-18 12:54
腾讯AI组织架构与人才引进 - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化大模型研发体系与核心能力 [2] - 前OpenAI研究员、AI领域顶尖人才姚顺雨加入腾讯,出任首席AI科学家,同时兼任AI Infra部、大语言模型部负责人 [2] - 姚顺雨现年27岁,本科毕业于清华大学姚班,博士就读于普林斯顿大学,曾为OpenAI核心成员,并入选《麻省理工科技评论》TR35榜单 [4] 姚顺雨的“AI下半场”理论 - 姚顺雨提出“AI下半场”理论,认为AI发展上半场核心是拼模型训练、比参数规模,而下半场竞争重心将转向真实场景的价值定义、交互体验优化和评估体系构建 [4] - 其理论核心逻辑是“评估比训练更重要”,行业需从“解决问题”转向“定义问题”,并更关注如何衡量真正的进展 [4][5] - 该理论契合当前AI行业从“炫技阶段”进入“实用阶段”的痛点,用户需要AI真正解决工作与生活中的真实问题 [4] 腾讯AI技术进展与产品落地 - 腾讯混元大模型过去一年发布超过30个新模型,12月5日发布的混元2.0在复杂推理与文本生成场景表现国内领先 [8] - 混元3D模型保持全球领先水准,开源社区下载量超过300万 [8] - 腾讯元宝AI应用用户规模稳居国内前三,AI能力已融入微信、QQ、音乐、会议等国民级产品 [9] - 腾讯混元大模型已在公司内部超过900款应用和场景中落地,超90%的腾讯工程师使用AI代码助手CodeBuddy,50%新增代码由AI辅助生成 [9] 架构升级的战略意义 - 本次架构升级被视为腾讯AI战略的关键一跃,旨在提升AI大模型研究能力,聚焦公司AI战略布局,提升研发效率 [7][8] - AI Infra部将负责大模型训练和推理平台技术能力建设,构建核心竞争力 [8] - AI Data部与数据计算平台部将分别负责大模型数据及评测体系建设、数据智能融合平台建设 [8] - 近期团队重组与高密度人才引进,旨在支撑高强度的技术攻坚 [10]
腾讯AI,大消息!
证券时报· 2025-12-18 12:50
腾讯AI战略与组织架构升级 - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化大模型研发体系与核心能力 [1] - 前OpenAI研究员、顶尖AI人才姚顺雨加入腾讯,出任首席AI科学家,同时兼任AI Infra部、大语言模型部负责人 [1] 关键人才姚顺雨及其行业观点 - 姚顺雨是AI领域顶尖新锐人才,27岁入选《麻省理工科技评论》TR35,曾为OpenAI核心成员,参与2025年首批智能体产品研发 [3] - 姚顺雨提出“AI下半场”理论,认为行业竞争重心将从拼模型训练、比参数规模转向真实场景的价值定义、交互体验优化和评估体系构建,核心逻辑是“评估比训练更重要” [3] - 姚顺雨认为AI下半场将从“解决问题”转向“定义问题”,取得成功需要调整思维模式和技能组合,更接近产品经理的能力模型 [4] - 姚顺雨的研究聚焦于让AI通过语言和推理能力成为解决广泛现实问题的工具 [4] 腾讯AI技术进展与产品落地 - 过去一年,腾讯混元大模型发布超过30个新模型 [7] - 混元2.0显著改进了预训练数据和强化学习策略,在复杂推理与文本生成场景表现国内领先 [7] - 混元3D模型保持全球领先水准,开源社区下载量超过300万 [7] - 腾讯元宝AI应用用户规模稳居国内前三,AI能力已融入微信、QQ、音乐、会议等国民级产品 [7] - 腾讯混元大模型已在公司内部超过900款应用和场景中落地 [7] - 腾讯内部超90%的工程师使用腾讯云代码助手CodeBuddy,50%新增代码由AI辅助生成,代码评审环节AI参与度达94% [7] 架构升级的战略意义 - 分析认为,此次大模型研发架构升级是腾讯AI战略的关键一跃 [6] - AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理等核心技术 [6] - AI Data部将负责大模型数据及评测体系建设,数据计算平台部将负责大数据和机器学习的数据智能融合平台建设 [6] - 此次升级旨在强化腾讯工程化优势,提升AI大模型研究能力,聚焦公司AI战略布局,提升研发效率 [6]
出自“清华姚班”的姚顺雨带队,腾讯升级大模型研发架构
南方都市报· 2025-12-17 20:09
公司组织架构与人事调整 - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化大模型研发体系与核心能力 [2] - OpenAI著名研究者姚顺雨加入腾讯,出任“CEO/总裁办公室”首席AI科学家,同时兼任AI Infra部、大语言模型部负责人 [2][3] - 姚顺雨毕业于清华姚班与普林斯顿大学,曾入选MIT TR35,此前在OpenAI担任研究科学家,专注于AI Agent开发 [3] - 王迪继续担任大语言模型部副总经理,向姚顺雨汇报;刘煜宏担任AI Data部负责人、陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报 [6] 公司战略与技术发展 - 此次架构升级旨在提升AI大模型研究能力,聚焦公司AI战略布局,提升研发效率 [6] - AI Infra部将负责大模型训练和推理平台技术能力建设,构建大模型AI Infra核心竞争力 [6] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [6] - 腾讯混元大模型发布超过30个新模型,混元2.0在复杂推理与文本生成场景表现国内领先,混元3D模型开源社区下载量超过300万 [4][5] - 腾讯内部正推进全面AI化效率变革,混元大模型已在内部超过900款应用和场景中落地 [7] 人才与研发投入 - 姚顺雨的加入被视为腾讯加强AI实力的信号,其提出的“AI下半场”概念引发业界共鸣 [4] - 腾讯公司副总裁蒋杰表示,AI时代会大量启用年轻人,让年轻人快速上位 [4] - 近期混元团队的重组与高密度人才引进,旨在支撑高强度的技术攻坚 [5] - 在腾讯公司内部,有超90%的腾讯工程师在使用腾讯云代码助手CodeBuddy,50%新增代码由AI辅助生成,代码评审环节AI参与度达94% [7]
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
量子位· 2025-12-17 18:00
腾讯AI组织架构与人才引进 - 腾讯内部官宣大模型研发组织架构调整,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化大模型研发体系与核心能力 [6] - 姚顺雨加盟腾讯,出任“CEO/总裁办公室”首席AI科学家,向总裁刘炽平汇报,同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [4][7] - AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理等核心技术 [8] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [8] - 此次架构升级旨在强化工程化优势,提升AI大模型研究能力,聚焦公司AI战略布局,提升研发效率 [8] 姚顺雨背景与成就 - 姚顺雨是前OpenAI研究员,拥有清华大学姚班背景和普林斯顿大学计算机博士学位,是NOI奥赛银牌得主和安徽省高考探花 [2][16] - 他是Tree of Thoughts(思维树)、ReAct等知名研究的作者,也是SWE-bench、SWE-agent等一系列研究的核心贡献者 [3][27] - 博士期间师从GPT-1第二作者Karthik Narasimhan,从事智能体方向研究,毕业后加入OpenAI [18] - 其研究工作贯穿Agent研究关键节点,包括提出CALM、WebShop等 [19] 姚顺雨的AI发展观点 - 姚顺雨在2024年8月发表博文《The Second Half》,提出AI正处在“中场休息”阶段 [21] - 他认为AI上半场以模型和方法为中心,核心是“把模型训出来”;下半场重心将转向任务定义、系统构建与评估体系 [22] - 关键问题从“能否训练模型解决XX”转向“什么问题值得被解决”以及“如何判断AI是否真的进步”,评估成为决定方向的前置条件 [23] - 真正重要的不是继续堆模型规模,而是让模型在真实任务和系统中经得起检验 [24] - 他认为Agent的本质不是“会用工具”,而是“能推理并泛化” [26] - 创业公司的最大机会不在模型,而在交互方式 [28] 腾讯AI产品与业务进展 - 过去一年,腾讯混元大模型发布了超过30个新模型 [9] - 2024年12月5日发布的混元2.0显著改进了预训练数据和强化学习策略,在复杂推理与文本生成场景表现国内领先 [9] - 混元3D模型保持全球领先水准,开源社区下载量超过300万 [9] - 腾讯元宝AI应用用户规模稳居国内前三,成为最受新中产欢迎的AI原生应用,上线初期保持每天一个版本的迭代频率 [10] - 腾讯将元宝的AI能力融入微信、QQ、音乐、会议等国民级产品中 [10] - 腾讯混元大模型已在内部超过900款应用和场景中落地,包括腾讯会议、微信、广告、游戏等 [10] - 公司内部超90%的工程师使用腾讯云代码助手CodeBuddy,50%新增代码由AI辅助生成,代码评审环节AI参与度达94% [10] 腾讯AI战略与行业地位 - 腾讯被认为拥有完备的AI要素:丰富场景、海量数据、生态资源,以及谋定后动的战略风格 [14] - 公司通过组织变阵、人才引进、产品(如元宝)和开源(如混元3D)等多方面举措,明显开启了AI进程上的提速 [12][13] - 引进姚顺雨这样的顶尖人才,被视为腾讯开启AI攻坚的证明 [11]
阿里吴泳铭为什么现在站出来造词?
虎嗅· 2025-09-25 07:25
公司战略与观点 - 公司CEO提出从通用人工智能AGI到超级人工智能ASI是终极目标[2] - 公司提出大模型是下一代操作系统,通义千问开源300多款模型,旨在成为AI时代的Android[11] - 公司提出AI云是下一代计算机[12] - 公司采用免费开源模型“跑马圈地”构建生态,再通过云服务实现商业化的模式,复刻谷歌Android商业模式[13] 财务与市场表现 - 公司港股股价在消息发布当日收盘涨幅达9%,创下4年历史新高[5] - 公司云业务2025年第二季度收入为333.98亿元,同比增长26%,增速创三年新高[8] - 公司云业务中AI相关收入占外部商业化收入比例已超过20%[8] 行业背景与竞争格局 - AI在中国的商业发展已进入下半场,各种商业机会涌现[6] - AI下半场的特点是评估比训练更重要,通过将智能转化为产品可打造巨大商业价值[6] - 参与下半场的创业公司是各大云平台的潜在客户,云平台竞争加剧[6] 未来投资与资源投入 - 公司计划未来3年投入3800亿元用于AI与云计算硬件基础建设[13] - 该投资计划意味着平均每月投入超过100亿元[13]
高阶程序,让AI从技术可行到商业可信的最后一公里
机器之心· 2025-09-16 19:57
AI发展阶段的转折 - 行业进入从模型竞赛转向工程竞赛的AI下半场 核心命题从AI能做什么转变为如何让AI做得对做得好不出错 [4] - 当前大模型在常见任务中可靠性仅达70%-85% 与金融医疗等领域99%以上的及格线存在巨大鸿沟 [14] - 实现AI广泛应用需要可靠性保障 涉及准确度速度确定性及幻觉问题等多个细分指标 [4] 数据与可靠性的核心地位 - 数据决定AI应用能力上限 但数据本身不会自动创造价值需要可靠加工引擎 [3] - 幻觉是当前AI范式下的固有系统性问题 源于训练评估程序奖励猜测而非承认不确定性 [8] - 行业需要将不确定的智能与确定的工程逻辑深度融合的新范式 [14] 现有技术方案的局限性 - RAG能降低幻觉但带来向量库集中化权限与陈旧数据风险 在合规敏感场景需谨慎设计 [9] - 智能体编排方便灵活但缺乏内部细粒度核验会导致错误放大 [9] - 神经-符号方法提升可解释性与判定性 但各方案对输出不确定性缺乏强约束 [4][9] 高阶程序(HOP)的工程化解决方案 - HOP是神经-符号主义思想的深度工程实践 为AI智力引擎构建可靠控制系统 [17][22] - 通过编程语言表达业务逻辑构建符号骨架 自然语言调用大模型处理神经任务 [23][25] - 核心机制HopLogic执行框架利用核验复杂性塌缩原理 实现99%以上可靠性 [28][29] - 建立完成率与正确率两大指标 使AI能力边界和可靠性可度量可管理 [34] HOP的实际应用效果 - 在金融风控建模中将可靠性从不足10%提升至99%以上 开发时长从数天缩短至1天以内 [42][43] - 通过内置精确业务规则确保每个关键节点行为受控 弥补传统AI框架短板 [46][47] - 提供比SFT更敏捷经济的迭代方式 通过优化程序逻辑等轻量级方法提升应用表现 [52] 行业标准化与生态发展 - 蚂蚁集团联合十余家机构起草大模型金融领域可信应用参考框架 核心思想与HOP一致 [48][50] - HOP开源推动开放生态建设 结合HopCorpus场景语料集构建提升能力上限 [64] - AI下半场始于数据成于工程 需要可靠框架与高质量数据双核心驱动 [55][64]
腾讯官方辟谣“前 OpenAI 研究员姚顺雨上亿薪资入职腾讯”
环球网· 2025-09-12 16:33
公司人事动态 - 腾讯官方澄清前OpenAI研究员姚顺雨以"上亿薪资"入职腾讯的报道为谣言 [1] 行业人才背景 - 姚顺雨本科毕业于清华大学姚班 获普林斯顿大学计算机科学博士学位 2024年加入OpenAI参与智能体产品operator与deep research开发 [3] - 姚顺雨博士期间提出思维树(Tree of Thoughts)框架改进决策模型 构建CoALA模块化认知架构 [3] - 主导ReAct方法首创语言智能体"推理—行动"交互范式 2025年主导Computer-Using Agent项目融入强化学习新范式 [3] 技术发展趋势 - 推动AI技术从训练导向转向评估导向 提出"AI下半场"概念 [3]
腾讯打出「AI岗位薪酬不限」的底气来自哪?
机器之心· 2025-06-13 12:31
AI行业发展趋势 - AI领域竞争重心正从模型参数与训练技巧转向定义有价值问题和构建真实场景评估体系[6] - 当前AI社区面临基准测试收益递减问题 基准饱和速度加快但解决现实问题进展有限[6] - 下半场需将AI嵌入人类环境 实现多轮互动式服务 如客服场景中的动态调整[6] 场景为王时代的公司选择标准 - 合格公司需具备持续做AI能力 包括大规模用户体量 高频刚需交互 多元化商业结构[11] - 技术-业务耦合强度是关键 AI应作为核心驱动力而非锦上添花 确保技术快速部署[12] - 商业化验证能力是试金石 需观察AI驱动营收案例和客户付费意愿[13] - 稳定商业回报才能支撑算力投入和人才薪酬 缺乏变现的企业面临生存挑战[14] 腾讯的AI场景优势 - 微信14.02亿月活和QQ5.34亿月活提供全球稀缺的高频社交场景[16] - 业务矩阵覆盖社交 游戏 广告 内容生产等 形成TOB+TOC完整数据闭环[16] - 混元模型和元宝等AI技术深度嵌入微信 《和平精英》AI队友等核心业务[17] - 2025Q1财报显示AI驱动广告收入增长20%至319亿元 游戏收入增长24%至595亿元[18] 腾讯青云计划人才机制 - 提供自由探索环境 非KPI导向 可自主选择游戏 广告等亿级用户场景课题[24] - 配备顶级科学家导师 协助梳理业务场景 2023年有成员28岁晋升T12专家[25][26] - 2025年升级筛选标准 通过CVPR会议 校企课题等渠道接触候选人[27][28] - 计划覆盖混元大模型 优图实验室等10+技术团队 提供群星晚宴等交流机会[29]