混元2.0
搜索文档
腾讯升级大模型研发架构 引入前OpenAI研究员姚顺雨任要职
新浪财经· 2025-12-17 21:57
公司战略与组织架构调整 - 腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化其大模型的研发体系与核心能力 [1] - 任命Vinces Yao(姚顺雨)为首席AI科学家,同时兼任AI Infra部和大语言模型部负责人,其背景为清华和普林斯顿大学毕业,曾任OpenAI研究员,是OpenAI首批智能体产品Operator与Deep Research的核心贡献者 [1] - AI Infra部负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理服务等核心技术 [2] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [2] - 此次架构升级旨在强化工程化优势,提升AI大模型研究能力,聚焦AI战略布局,提升研发效率 [2] 公司人才与产品进展 - 近期混元团队加速招募AI人才,来自大厂、AI六小虎的数位核心员工已加入腾讯,以支撑高强度的技术攻坚 [2] - 混元旗舰模型TurboS是业界首个基于混合线性注意力机制落地的超大规模MoE模型,自年初发布后保持每月一个版本的迭代速度 [3] - 腾讯于12月5日推出最新旗舰模型混元2.0,并于今日发布世界模型1.5,该模型系国内首个开放体验的实时世界模型 [3] 行业竞争动态 - 不仅腾讯AI提速,字节跳动、阿里巴巴等大厂年内AI战略决心明确,重磅动作频频 [3] - 字节跳动旗下豆包手机受关注,其火山引擎FORCE原动力大会预计将发布豆包大模型新品 [3] - 阿里巴巴已成立千问C端事业群,由原智能信息与智能互联两个事业群合并重组而来,包含千问APP、夸克、AI硬件、UC、书旗等业务,首要目标是将千问打造成一款超级APP,成为AI时代用户的第一入口 [3] 行业发展趋势与竞争关键 - 国内大厂正围绕算力设施层、模型层、应用层全面发力 [4] - AI应用层面的竞争不会简单收敛为大厂之间的较量,随着算力和基础模型能力普及,行业差异化的关键转向围绕具体使用场景与行业工作流程构建可持续的竞争力壁垒,这类能力是第三方独立厂商最具价值且最难被规模化复制的竞争优势 [4]
腾讯(00700)AI,悄然加速
智通财经网· 2025-12-17 21:16
中国AI行业竞争格局 - 2025年中国AI竞争已从模型参数转向资本效率、基础设施与流量入口的综合博弈 [1] - 国内形成路线迥异的三方竞争:阿里重资产投入、字节流量突围、腾讯采用“内生验证+外溢赋能”策略 [1] 腾讯AI战略演进 - 2023年前为“研判期”,公司保持防御姿态,聚焦底层技术研发与场景预研 [4] - 2024年进入调整期,采取“坚定投入自研模型+开放拥抱先进开源模型”的多模型策略,并积极接入DeepSeek模型 [4] - 2025年进入“主动出击期”,通过组织重构和生态渗透加速,挖来OpenAI人才并重组混元团队 [5] 腾讯近期组织与产品动态 - 公司于12月17日升级大模型研发架构,正式成立AI Infra部、AI Data部、数据计算平台部,以强化研发体系 [2] - 任命Vincesyao为首席AI科学家,直接向总裁汇报并兼任AI Infra部、大语言模型部负责人,实现汇报关系扁平化以提升效率 [2] - 同日,腾讯混元世界模型1.5正式上线,是国内首个支持“实时互动”的世界模型,用户可生成并自由探索3D虚拟世界 [3] 腾讯AI技术进展与策略 - 过去一年,腾讯混元大模型迭代了30多个版本,在文生图、3D生成等领域保持全球领先 [5] - 近两个月发布混元2.0、混元3D 3.0和混元图像3.0,其中混元图像3.0在LMArena文生图榜单中位列第一 [5] - 公司采取“自研+接插件”的实用主义模式,在微信、元宝等产品中同时接入自研混元与DeepSeek等外部开源模型 [5][6] - 混元大模型已在公司内部超过900个场景和应用落地,尤其在广告、游戏等核心业务中提升效率 [6] 腾讯的生态与连接战略 - 公司依托微信、QQ等生态内十几亿用户的行为数据,形成“数据反哺模型优化,模型提升场景体验”的闭环 [7] - 公司认为AI时代竞争终局是场景渗透率的竞争,正构建“社交×服务×AI”的闭环系统 [7] - 在C端,元宝AI应用用户规模稳居国内前三,并战略定位为腾讯生态的“连接器”,与微信、QQ音乐、腾讯视频等产品深度联动 [8] - 在B端,腾讯云推出智能体开发平台,通过低代码方式降低企业AI使用门槛,并可将智能体一键发布至微信生态 [9][10] - 腾讯云的AI代码助手已在金融、政务等30多个场景中辅助生成公司内部50%的新增代码 [10] - 公司通过“双轨Agent”策略布局未来:通用Agent(如元宝)与生态Agent(基于微信独特生态运行的智能体) [12][13] 市场观点与比较 - 国海证券研报基于SOTP估值方法,给予2026年腾讯控股目标市值6.5万亿元人民币/7.1万亿港元,对应目标价773港元 [6] - 国信证券分析师认为,腾讯生态的用户与场景天然优势使其成为AI时代最佳卡位的企业之一 [7] - 公司的AI战略被类比为谷歌,凭借强大生态整合能力,使AI能力无处不在,形成“数据-场景-技术”飞轮 [12]
出自“清华姚班”的姚顺雨带队,腾讯升级大模型研发架构
南方都市报· 2025-12-17 20:09
此前有消息称,OpenAI著名研究者姚顺雨已经加入了腾讯混元大模型团队,他将在混元组建一支自己 领导的研究团队,年薪达上亿元。当时腾讯在其官方公众号辟谣称该消息为假消息。 作为AI界的顶尖人才,姚顺雨身上有不少"天才"叙事。资料显示,姚顺雨毕业于著名的"清华姚班",之 后在普林斯顿大学进修计算机科学博士。其间,"27岁入选MIT TR35"的光环,以及他作为清华大学学 生说唱社联合创始人的经历,常被外界津津乐道。 2024年8月,姚顺雨加入了OpenAI。在OpenAI期间,他担任研究科学家,专注于将大型语言模型从理论 研究推向实际应用,特别是AI Agent的开发。据悉,其主导开发了OpenAI 首个发布的智能体模型及产 品,同时参与了Deep Research项目。 腾讯混元是腾讯AI研发的核心团队,任何顶尖人才的加入都可能被视为其加强AI实力的信号。此前, 姚顺雨曾提出"AI下半场" 概念,即从追求模型规模到定义有用任务,引发业界共鸣。他的职业选择无 疑也被视为对AI未来发展方向的一种预示。 今年 5月姚顺雨在一次对谈中被问到,如果自己主管微信,会如何在微信中做agent。姚顺雨表示自己会 先观望和探索 ...
海外科技行业 2025 年第 46 期:GPT-5.2再提模型能力上限,阿里发力C端入口建设
国泰海通证券· 2025-12-13 20:52
报告行业投资评级 - 维持行业增持评级 [6] 报告核心观点 - 报告核心观点围绕三大行业动态展开:GPT-5.2发布标志着大模型在专业与企业级应用能力上的显著提升;阿里巴巴成立C端事业群,旨在整合资源打造AI时代的超级入口;特朗普政府批准H200对华出口,将提升国内AI训练端算力供给 [3][6] 周观点总结 - **GPT-5.2发布**:OpenAI于12月11日发布GPT-5.2,主打通用智能、编码和长上下文处理能力,在信息检索、写作、翻译、数学推演与编程任务中进一步提速 [9] - **GPT-5.2性能表现**:在GDPval专业技能测试中,GPT-5.2得分70.9%,分别领先GPT-5.1和Gemini 3 PRO达32.1%和17.4%,在ARC-AGI基准测试中也大幅领先 [9] - **GPT-5.2版本与定价**:模型分为Instant、Thinking、Pro三个版本,对应不同需求;API价格上调,输入费用为每百万tokens 1.75美元,输出费用为每百万tokens 14美元 [9] - **阿里巴巴组织调整**:12月9日,阿里巴巴宣布成立千问C端事业群,整合智能信息与智能互联业务,产品矩阵包括千问APP、夸克、AI硬件、UC及书旗等 [10] - **阿里C端战略目标**:计划将地图、外卖、办公、健康等生活服务接入千问,目标是将其打造为AI时代的超级APP和用户首选触点,构建以自身为核心的AI新生态 [10] - **阿里C端现状**:目前阿里C端AI布局主要依托夸克,其In-APP AI同类排名第十,月活跃用户达6359万,但在C端缺乏头部领跑者,整体存在感有待提升 [10] - **H200对华出口获批**:12月8日,特朗普政府批准英伟达向中国出口H200芯片,但需向美国政府支付25%的销售分成,较H20的15%提高了10个百分点 [11] - **H200芯片性能**:H200采用台积电4N工艺,内置800亿晶体管,热设计功耗700W,FP16算力高达989T,是H20的6-8倍,互联带宽也是H20的两倍 [11] - **H200的影响**:国内大厂未交付的H20订单有望转为H200订单;预计H200将主要用于训练场景,对国产AI芯片在推理场景的冲击有限 [11][14] 一周行情回顾总结 - **大盘指数表现**:在2025年12月7日至13日期间,恒生指数下跌0.42%,恒生科技指数下跌0.43%;道琼斯工业指数上涨1.05%,纳斯达克指数下跌1.62% [11][19] - **板块指数表现**:同期,恒生互联网科技业指数上涨0.44%,HK网络游戏指数下跌0.25%,HK AIGC概念指数上涨0.70%,纳斯达克中国金龙指数下跌1.04% [15][20] - **港股重点个股**:周涨幅前三为美团-W(上涨3.4%)、商汤-W(上涨3.3%)、腾讯控股(上涨1.0%) [16] - **美股重点个股**:周涨幅前三为OKTA(上涨5.0%)、TWILIO(上涨4.4%)、声网(上涨3.7%) [16] 一周AI行业要闻总结 - **美联储降息**:美联储于12月11日宣布降息25个基点至3.5%—3.75%区间,为年内第三次降息,累计降幅达75个基点 [25] - **铠侠技术进展**:铠侠计划于2026年量产下一代BiCS10 3D NAND闪存,采用332层堆叠技术,位密度较现有BiCS8提升59% [25] - **智谱开源模型**:智谱上线并开源GLM-4.6V多模态大模型,训练上下文窗口提升至128k tokens,价格较GLM-4.5V下降50% [25] - **腾讯发布混元2.0**:腾讯发布自研大模型混元2.0,采用MoE架构,总参数量406B,支持256K上下文窗口;DeepSeek V3.2同步接入腾讯生态 [26] - **美团开源图像模型**:美团LongCat团队开源6B参数的LongCat-Image模型,在多项图像编辑基准测试中达到开源SOTA水平 [26] - **英伟达更新CUDA**:英伟达发布CUDA Toolkit 13.1,为20年来最大更新,引入了基于tile的编程模型等新特性 [27] - **英伟达小模型表现**:英伟达4B参数小模型NVARC在ARC-AGI 2测试中以27.64%的成绩击败GPT-5 Pro(18.3%),单任务成本仅为后者的约1/36 [27] - **博通财报**:博通2025财年第四财季营收达180.15亿美元,同比增长28%,AI半导体业务营收激增74% [28] - **甲骨文财报与开支**:甲骨文2026财年第二财季营收增长14%至161亿美元,宣布将年度资本开支大幅上调约150亿美元以建设AI基础设施 [28] 投资建议总结 - **算力方向**:推荐英伟达(NVDA.O)、台积电(TSM.N)、阿斯麦(ASML.O)、博通(AVGO.O)、迈威尔(MRVL.O) [29] - **云厂商方向**:推荐北美三大云厂商微软(MSFT.O)、亚马逊(AMZN.O)、谷歌(GOOGL.O) [30] - **AI应用方向**:推荐AI Agent方向的苹果(AAPL.O)、高通(QCOM.O)、联想集团(0992.HK)、小米集团(1810.HK),以及Physical AI方向的特斯拉(TSLA.O) [30] - **AI社交方向**:推荐AI赋能下的社交网络巨头腾讯控股(0700.HK)、Meta(META.O)、谷歌(GOOGL.O) [30]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-12-13 10:33
| 类别 | Top关键词 | 主体 | | --- | --- | --- | | 芯片 | H200出口 | 英伟达 | | 芯片 | 新GPU架构 | 摩尔线程 | | 算力 | CUDA Toolkit 13.1 | 英伟达 | | 算力 | 太空AI | Starcloud | | 模型 | Titans架构 | 谷歌 | | 模型 | 深度思考模式 | 谷歌 | | 模型 | GLM-4.6V | 智谱 | | 模型 | LongCat-Image | 美团 | | 模型 | 混元2.0 | 腾讯 | | 模型 | NVARC小模型 | 英伟达 | | 模型 | 新模型测试 | OpenAI | | 模型 | Devstral 2 | Mistral AI | | 模型 | 「牛油果」 | Meta | | 应用 | AI可穿戴设备 | Meta | | 应用 | AI面试官 | Anthropic | | 应用 | VibeVoice | 微软 | | | Realtime-0.5B | | | 应用 | 主体库功能 | 可灵 | | 应用 | Qwen3-TTS | 阿里 | | 应用 | A ...
人形机器人上岗忙,大模型迭代不停:12.1-12.7 核心动态
搜狐财经· 2025-12-10 17:45
1. 特斯拉Optimus展示慢跑能力:Optimus官方发布实验室慢跑视频,速度达2-2.5m/s,稳定性显著提升,同步展示多机充电场景,强化2026年量产预期。 12.1-12.7,全球 AI 领域模型迭代与技术突破并行,机器人产业政策支持、场景落地与出海加速共振,核心动态亮点纷呈。 5. 曹操出行与人形机器人入驻Robotaxi场景:曹操出行与越疆科技合作,越疆Atom人形机器人入驻杭州"绿色智能通行岛",完成导览、无人运维等多场景验 证。 6. 英伟达开源自动驾驶核心模型Alpamayo - R1:开放模型与数据集,提升自动驾驶AI推理效率与泛化能力,降低行业研发门槛,推动技术生态共建。 7. 杭州AI交警机器人"杭行1号"上岗:滨江区滨盛路长河路口正式投入"实习",执行交通疏导、信息交互等任务,助力智慧交管落地。 8. Mistral AI发布Mistral 3系列:欧洲AI公司推出新一代开放模型,全线采用Apache 2.0许可证,兼顾性能与开源生态,强化欧洲AI竞争力。 9. 优艾智合发布双臂协作巡操机器人"钧仪":全球首款,已在南方电网220千伏变电站高压室执行高危巡检,提升电力运维自动化与安 ...
腾讯研究院AI速递 20251209
腾讯研究院· 2025-12-09 00:01
微软开源轻量级实时TTS模型 - 微软开源0.5B参数的实时TTS模型VibeVoice-Realtime-0.5B,首包延迟仅300毫秒,支持流式朗读,发布12小时获得12.3K星标 [1] - 模型采用交错窗口架构支持长文本无卡顿朗读,最多支持4个角色自然对话,具备情绪识别与表达能力,长时上下文记忆可达90分钟 [1] - 模型同时支持中英文语音生成,在LibriSpeech和SEED TTS测试集上错字率约2%,说话人相似度达0.65以上 [1] 智谱开源多模态大模型GLM-4.6V - 智谱正式上线并开源GLM-4.6V系列多模态大模型,包括106B-A12B基础版和9B轻量版Flash,训练上下文窗口提升至128k tokens,价格相较GLM-4.5V降低50% [2] - 首次在模型架构中将Function Call能力原生融入视觉模型,实现“图像即参数,结果即上下文”的多模态工具调用 [2] - 在同参数规模下达到SOTA表现,9B版本整体超过Qwen3-VL-8B,106B参数版本比肩2倍参数量的Qwen3-VL-235B [2] 可灵O1推出主体库与对比模板功能 - 可灵O1推出“主体库”功能,支持上传多角度参考图构建专属角色、道具和场景,视频O1支持至多7个主体,图片O1支持至多10个主体组合 [3] - 新增AI补图功能,可根据一张主要参考图自动扩展更多视角并智能生成主体描述 [3] - “对比模板”功能一键整合多模态创作,实现Prompt、参考图、主体等所有输入与最终成品的同框对比 [3] 美团开源图像编辑模型LongCat-Image - 美团LongCat团队发布并开源6B参数LongCat-Image模型,在ImgEdit-Bench(4.50分)、GEdit-Bench中英文(7.60/7.64分)等图像编辑基准测试中达到开源SOTA水平 [4] - 采用文生图与图像编辑同源架构及渐进式学习策略,在中文文字生成方面ChineseWord评测以90.7分大幅领先,覆盖通用规范汉字表8105个汉字 [4] - 全面开源文生图多阶段模型和图像编辑模型,GenEval 0.87分、DPG-Bench 86.8分的表现使其在生图基础能力上具备强竞争力 [4] 腾讯发布混元2.0大模型并接入DeepSeek - 腾讯自研大模型混元2.0正式发布,采用MoE架构,具备406B总参数量(激活参数32B),支持256K超长上下文窗口 [5][6] - DeepSeek V3.2同步在腾讯生态内接入,重点提升推理表现与长文本生成质量,在公开推理类评测中能力达GPT-5水平,略低于Gemini-3 Pro [6] - 两大模型已在腾讯AI原生应用中上线,腾讯云同步开放API及平台服务,多款产品正在陆续接入 [6] 阿里发布多语言多方言TTS模型Qwen3-TTS - 阿里通义团队发布Qwen3-TTS新一代文本转语音模型,提供49种高保真角色化音色 [7] - 支持10种语言和9种中文方言,保留真实语调与地域口音 [7] - 在MiniMax TTS multilingual test set上平均WER表现优于竞品,韵律控制相比上一代有明显感知级提升 [7] 英伟达小模型在AGI测试中成本优势显著 - 英伟达4B小模型NVARC在ARC-AGI 2测试中以27.64%公开榜成绩力压GPT-5 Pro的18.3%登顶榜首,每任务成本仅20美分,约为GPT-5 Pro单任务成本的1/36 [8] - 采用零预训练深度学习方法,通过大规模合成高质量数据(320万+增强样本)和测试时微调技术,针对每个问题进行LoRA微调快速适应 [8] - 选用Qwen3-4B小参数模型通过对话式模板简化谜题理解,借助NeMo RL框架进行监督微调 [8] 普渡发布行业级自主导航四足机器人 - 普渡机器人正式发布行业级自主导航四足机器人PUDU D5系列,提供轮足/点足两个版本,搭载NVIDIA Orin与RK3588双芯片架构,总算力高达275TOPS [9] - 配备四目鱼眼相机与双192线激光雷达,实现厘米级精准定位和环境重建,可稳定承载30公斤负载,单次充电续航达14公里,整机防护IP67 [9] - 采用仿生轮足融合系统,最高速度可达5米/秒,具备30°斜坡攀爬与25厘米连续越阶能力,适用于多场景应用 [9] 关于大语言模型使用方法的观点 - 观点认为不应把大语言模型看作实体,而应视作模拟器,避免使用“你怎么看”这样的提问方式 [10] - 建议采用更有效的提问策略,让LLM引导或模拟多种视角,而非局限于单一AI人格 [11] - 强调模型的“你”是被刻意设计并硬加上去的,通过SFT和RLHF构建的复合人格本质上仍建立在Token模拟引擎之上 [11]
豆包AI助手"理想丰满现实骨感"?大摩:手机大厂更倾向自研,要落地很困难
硬AI· 2025-12-02 17:07
文章核心观点 - 摩根士丹利对字节跳动豆包手机AI助手的商业化前景持谨慎态度,认为其系统级整合面临重大落地挑战,并更看好现有“超级应用”在AI领域的投资机会 [2][3][4] 豆包AI助手功能与挑战 - 豆包AI助手演示版本于12月1日发布,展示多模态与代理能力,可通过语音或侧边键唤醒,实现读取屏幕、跨应用比价及行程规划等功能 [7] - 该助手深度嵌入智能手机操作系统,采用中兴样机展示,售价为人民币3499元 [7] - 其落地执行面临重大挑战,因深度系统整合需修改操作系统,触及手机厂商利益核心,将削弱OEM在供应链中的议价能力 [2][7] 行业竞争格局与巨头博弈 - 掌握硬件入口的头部手机厂商如苹果、华为、小米倾向于自行开发AI助手,而非与字节跳动合作,留给后者的OEM选择非常少 [9][10] - 豆包构建广泛硬件生态系统面临极高准入门槛,尤其是在竞争激烈的中国市场 [11] - 字节跳动已表明不计划自主开发智能手机,正与多家手机厂商讨论潜在合作,其商业模式可行性成为市场焦点 [12] 投资逻辑与看好标的 - 摩根士丹利建议资金继续流向拥有庞大流量和场景的软件应用巨头,认为微信、淘宝、美团等“超级应用”地位难以撼动,且均在构筑自身AI护城河 [14] - 公司重申对腾讯、阿里巴巴和美图的“增持”评级 [4][14] - 腾讯被视为中国最佳AI应用代理,将很快推出下一代AI模型混元2.0以巩固地位 [14] - 阿里巴巴是中国最佳AI基础设施标的,其云收入增长有望加速 [14] - 美图作为AI多模态受益者,其“最后一公里”服务能力是通用AI助手难以替代的价值所在 [14]
豆包AI助手"理想丰满现实骨感"?大摩:手机大厂更倾向自研,要落地很困难
美股IPO· 2025-12-02 13:02
文章核心观点 - 摩根士丹利对字节跳动豆包手机AI助手的商业化前景持谨慎态度,认为其系统级整合面临重大落地挑战,主要因触及手机厂商利益核心[1][4][5] - 公司维持对腾讯、阿里巴巴、美图等应用层股票的看好,重申"增持"评级,认为"超级应用"的护城河难以被系统级AI助手颠覆[1][6][10] 豆包AI助手技术特性 - 豆包AI助手演示版本展示多模态与代理能力,支持语音或侧边按键唤醒,可实现读取屏幕信息、跨应用比价、行程规划等功能[7] - 演示机型采用中兴样机(Nubia M153),售价为人民币3499元[7] 落地执行挑战 - 系统级整合需修改操作系统,直接触动手机厂商利益核心,削弱OEM在供应链中的议价能力[5][7] - 实现推广需与不同智能手机OEM进行深入技术合作和商业谈判,但头部厂商更倾向自研AI助手[7][8] - 苹果、华为、小米等具备强技术能力的OEM大概率自研AI助手,字节跳动可合作的选择非常有限[8] 行业竞争格局 - 掌握硬件入口的头部厂商拒绝交出控制权,豆包构建广泛硬件生态系统面临极高准入门槛[8] - 字节跳动已表明不计划自主开发智能手机,正与多家手机厂商讨论潜在合作,商业模式可行性受关注[9] 投资策略与标的分析 - 资金应继续流向拥有庞大流量和场景的软件应用巨头,中国"超级应用"地位难以撼动[10] - 腾讯被视为中国最佳AI应用代理,将推出下一代AI模型混元2.0以巩固AI领域地位[11] - 阿里巴巴是中国最佳AI基础设施标的,云收入增长有望加速[11] - 美图作为AI多模态受益者,其"最后一公里"服务能力具有不可替代性[12]