Workflow
Seed 2.0
icon
搜索文档
混元重建后,姚顺雨在腾讯交出第一份成绩单
新华网财经· 2026-04-23 22:14
混元Hy3 preview模型发布 - 公司于4月23日正式发布并开源混元Hy3 preview语言模型 这是首席AI科学家姚顺雨入职近四个月后的首份成绩单 [1] - 该模型为混合专家模型 总参数2950亿 激活参数210亿 最大支持256K上下文长度 [1] - 模型已在元宝、ima、WorkBuddy、CodeBuddy等内部产品上线 微信公众号、腾讯新闻等产品也将陆续接入 [1] 模型性能与研发策略 - Hy3 preview是混元团队重建大模型研发基础设施后训练的第二个模型 也是迄今最智能的模型 在聊天、代码、智能体、数理推理等实用能力上实现大幅提升 [2] - 从研发架构升级、基础设施重建到上线发布 该模型仅用了不到三个月时间 而行业通常一个大版本周期需6-12个月 [2] - 团队研发思路是不盲目堆叠参数 而是将核心资源投入数据质量 Hy3 preview总参数小于前一版本 但更“实际” 团队认为3000亿参数是能力与效率的最优平衡带 [2] - 3000亿级别的MoE模型经量化后可实现单机部署 大幅降低了部署硬件成本 [3] 组织与战略调整背景 - 2026年1月 公司高层公开承认在AI上“动作慢了” 问题可能在于基础设施不足、模型迭代频率和平台能力 [4] - 随后公司重构了混元团队的组织方式和工作流程 重点提升数据质量 并重建了预训练与强化学习的基础设施 [4] - 几乎同时 公司解散了设立十年的AI Lab 以解决研发团队分布在不同事业群、协同成本高的问题 旨在打破部门墙 [4] - 团队指出 过去的混元模型过度追逐榜单成绩 导致训练数据被污染 影响了真实场景表现 因此Hy3 preview未完全依赖公开评测集 而是自建了50多个评测基准来评估实际能力和落地性 [4] 未来发展规划 - 团队将通过此次发布收集全面体验反馈 以提升Hy3 preview正式版的实用性 [5] - 团队将继续扩大预训练和强化学习的规模以提升智能上限 并通过与内部产品的深入协同设计来提升模型实用性 并探索非同质化的模型能力 [5] - 在新的基础设施和技术理念支撑下 更大尺寸的模型也已经在路上 [6] 行业竞争格局 - 公司面临激烈的市场竞争 字节跳动在两个月前先后发布了Seed 2.0大语言模型和视频生成模型Seedance 2.0 并持续高频更新 [6] - 第三方数据显示 一季度字节跳动的豆包应用月活已达3.45亿 用户规模居国内AI应用首位 [6] - 阿里巴巴本月发布了Qwen3.6的多个版本 并认领了近期“屠榜”的神秘视频生成模型HappyHorse [6] - 另一个变量是DeepSeek-V4的发布 公司产品元宝曾快速接入DeepSeek破圈 但也因此产生依赖而陷入被动 有报道称公司与阿里正在洽谈投资DeepSeek 目标估值超200亿美元 [6] 公司的差异化优势 - 公司高管认为 主流大模型的能力差距正在逐步缩小 企业的核心需求已转向如何通过系统工程最大化发挥模型能力 真正拉开差距的是工程化交付能力 [7] - 在相同模型能力下 大模型脚手架或Harness的设计对实际使用效果与tokens成本有很大影响 公司旗下丰富的场景入口、工具生态可为此提供优势条件 [7]
研报掘金丨中金:Seedance 2.0将带动视频模型推理需求,关注AI基建及IDC企业
格隆汇· 2026-02-25 10:30
字节跳动Seedance 2.0与Seed 2.0模型进展 - 字节跳动发布的Seedance 2.0较先前版本在生成质量、复杂动作与分镜、一致性与指令遵循,以及音画同步等方面均有明显提升 [1] - Seedance 2.0迅速在海内外创作者及更广大群体中出圈 [1] - 新一代基座模型Seed 2.0在多模态、推理、编程等场景亦全面进步 [1] 投资建议与关注方向 - 建议关注AI基础设施以及IDC相关企业,包括万国数据、世纪互联、东阳光 [1] - 建议关注多模态视频相关AI应用生态以及字节跳动产业链相关厂商 [1] - 予万国数据美股及世纪互联"跑赢行业"评级,目标价分别为60美元及15美元 [1]