海内外云厂系列调研
2026-04-13 14:13

行业与公司 * 涉及的行业为人工智能(AI)与云计算行业,特别是生成式AI(AIGC)领域,包括文生视频、文生文等模型及应用 [1] * 涉及的公司主要为字节跳动及其旗下业务(火山引擎、豆包大模型、即梦/剪映、抖音、头条、扣子等),并提及了阿里巴巴(阿里云、万象模型)、快手(可灵模型)、华为、寒武纪、海光、英伟达等公司 [1][3][4][5][6][18][19][20][21] 核心观点与论据 1. Happy House 模型的技术特点与市场定位 * 技术优势:在Arina双盲人工评测中表现优异,核心优势在于画面画质、指令遵循度以及多人物复杂场景处理,尤其在处理3至5个以上人物的场景时,对五官、手指等细节还原度高 [3] * 算力效率高:官方称使用单块H100生成5秒视频仅需38秒,算力效率领先于部分需要多卡并行的闭源模型 [1][4] * 应用场景:其多真人场景处理能力领先,非常适用于真人短剧制作,与国内模型更擅长的漫剧制作形成差异化 [5] * 功能短板:缺乏全模态参考(声音、视频等输入)、分镜、高频对话等提升工业化生产效率的关键工具,因此在整体生产流程性价比上存在短板 [1][4][5] * 模型参数与归属:核心部分参数量约十几B(十亿),层数约40层,计划开源;其确切归属(是否属于阿里)尚存疑,可能与阿里万象系列模型重名 [3][4][5] * 架构推测:即使属于阿里体系,其架构也可能经历了明显重构,而非在原有万象系列上迭代,因为其在人像表现上提升巨大但基础生产力功能缺失 [6] 2. 字节系Token消耗量:规模、结构与增长驱动力 * 总体规模:截至2026年3月,豆包大模型日均消耗120万亿Tokens火山引擎日均消耗100万亿Tokens,但两者统计口径存在差异 [1][6][14] * 消耗结构: * 在豆包大模型120万亿日均消耗中:ToB服务(火山引擎公有云)占比约20%(约25-26万亿)ToC业务(豆包APP、即梦等)占比约20%(约25万亿)内部业务及端侧部署占比约60% [1][14][15] * 火山引擎的100万亿消耗包含了大量内部业务(如员工使用、抖音直播间监控) [7][13] * 增长驱动力: * ToB业务是主要增长引擎:2026年第一季度末,火山引擎公有云ToB服务日均消耗超25万亿Tokens,较2025年末实现翻倍增长 [1][15] * 文生视频业务增长突出:以剪映(即梦)中的文生视频模型为例,日均消耗约8万亿视觉Tokens(算力成本远高于文本) [1][7] * Coding Plan低价策略刺激:该按调用次数计费、不限制Tokens的套餐价格极具吸引力,刺激了编程等场景的调用量 [1][8] * 用户不可见的后台计算:平台统计的Token消耗远高于用户感知,因为计入了在线检索网页内容、个性化与记忆机制等后台处理环节的Tokens [9] 3. 盈利能力与定价策略 * 文生文业务:在火山引擎上,基于成熟基模的文本推理服务毛利率接近30%(约27-28%) [1][17] * 文生视频业务盈利能力因渠道分化 * 火山引擎渠道利润较高:定价为平均每秒1元,设置高采购门槛(起充100万元或年消费1000万元大客户) [17][18] * 即梦平台目前不赚钱:虽然单次生成有约20%以上毛利,但因提供免费积分策略,整体处于不赚钱状态 [1][17] * Coding Plan:已于2026年3月31日后停止,该计划定价约50元/月允许调用9万次且不限制Tokens,导致巨亏 [17] 4. 算力储备与采购计划 * 当前算力存量: * 英伟达芯片H20最多(30-35万张);A系列(A100/A800)约12-13万张,是当前服务主力但将进入衰退期;H系列(H100/H800)不足10万张,极度紧缺 [19] * 国产芯片华为升腾910系列超10万张(约11-12万张)寒武纪思元590系列超25万张(尚未完全上架) [20] * 2026年采购计划: * 国内采购:计划采购寒武纪590/690型号共计25万张以上;采购300套华为384超节点方案(总计超10万颗芯片,初期为910B/C,后续转向950PR);增加海光芯片采购(至少5万颗以上) 作为备份 [21] * 海外采购:预算超1000亿人民币(可能达1200亿),采购型号包括英伟达H200、B200及GB200 [1][21] 5. 2026年业绩目标与增长预期 * 云业务整体营收:目标从2025年的220-250亿元增长至超400亿元同比增长60-70%以上 [2][22] * AI云业务收入:预期从2025年的50多亿元增长至2026年的120亿元左右 [2][22] * 业务量目标:对于MaaS、PaaS等成熟业务,要求实现3到5倍增长,其中MaaS和PaaS目标是5倍 [2][22] * Tokens调用量:增长迅猛,最初设定的10倍增长目标已显保守;第二季度实际日均消耗量将远超此前预测的200万亿 [22] 其他重要内容 1. 市场竞争格局与火山引擎优势 * 企业采购市场份额:截至2026年第一季度末,千问市场份额约25-30%,豆包约18%且缓慢上涨,其后是DeepSeek [7] * 火山引擎文生视频高定价的竞争优势充足的合规高端算力(H100/H800)短视频流量生态扶持API综合价值高(可投流抖音、反哺即梦社区),形成生态闭环 [18] 2. 模型能力边界与应用案例 * 拍题解题应用:大模型主要提升在于题目“标准化”处理,但核心依赖大规模题库(讯飞、字节题库超1亿条);对于非数学类的复杂图文结合题,现有模型能力有限 [11] * Agent应用(如“龙虾”项目):高峰时日活超200万,单用户日均消耗可超100万Tokens,但近期热度降温 [8] * 抖音直播间监控:是内部Token消耗的重要场景,高危直播间监控消耗可达每分钟3万Tokens以上 [7] 3. 统计口径差异与数据解读 * 豆包与火山引擎数据差异:源于豆包大模型可运行在非火山引擎平台(如私有化部署),这部分消耗计入豆包但不计入火山引擎 [14] * Token消耗统计可能被夸大:存在将主要消耗CPU的任务(如在线检索的网页预处理)计入Token总量的现象 [10] * 豆包APP日活口径:净日活用户接近1.1亿(1.07-1.08亿),仅统计通过官方客户端访问的用户,不包含在头条等应用内调用的用户 [16]

海内外云厂系列调研 - Reportify