HappyHouse 模型
搜索文档
海内外云厂系列调研
2026-04-13 14:13
行业与公司 * 涉及的行业为人工智能(AI)与云计算行业,特别是生成式AI(AIGC)领域,包括文生视频、文生文等模型及应用 [1] * 涉及的公司主要为字节跳动及其旗下业务(火山引擎、豆包大模型、即梦/剪映、抖音、头条、扣子等),并提及了阿里巴巴(阿里云、万象模型)、快手(可灵模型)、华为、寒武纪、海光、英伟达等公司 [1][3][4][5][6][18][19][20][21] 核心观点与论据 1. Happy House 模型的技术特点与市场定位 * **技术优势**:在Arina双盲人工评测中表现优异,核心优势在于**画面画质、指令遵循度以及多人物复杂场景处理**,尤其在处理3至5个以上人物的场景时,对五官、手指等细节还原度高 [3] * **算力效率高**:官方称使用单块H100生成5秒视频仅需38秒,算力效率领先于部分需要多卡并行的闭源模型 [1][4] * **应用场景**:其多真人场景处理能力领先,**非常适用于真人短剧制作**,与国内模型更擅长的漫剧制作形成差异化 [5] * **功能短板**:缺乏**全模态参考(声音、视频等输入)、分镜、高频对话**等提升工业化生产效率的关键工具,因此在整体生产流程性价比上存在短板 [1][4][5] * **模型参数与归属**:核心部分参数量约十几B(十亿),层数约40层,计划开源;其确切归属(是否属于阿里)尚存疑,可能与阿里万象系列模型重名 [3][4][5] * **架构推测**:即使属于阿里体系,其架构也可能经历了明显重构,而非在原有万象系列上迭代,因为其在人像表现上提升巨大但基础生产力功能缺失 [6] 2. 字节系Token消耗量:规模、结构与增长驱动力 * **总体规模**:截至2026年3月,**豆包大模型日均消耗120万亿Tokens**,**火山引擎日均消耗100万亿Tokens**,但两者统计口径存在差异 [1][6][14] * **消耗结构**: * 在豆包大模型120万亿日均消耗中:**ToB服务(火山引擎公有云)占比约20%(约25-26万亿)**;**ToC业务(豆包APP、即梦等)占比约20%(约25万亿)**;**内部业务及端侧部署占比约60%** [1][14][15] * 火山引擎的100万亿消耗包含了大量内部业务(如员工使用、抖音直播间监控) [7][13] * **增长驱动力**: * **ToB业务是主要增长引擎**:2026年第一季度末,火山引擎公有云ToB服务日均消耗超25万亿Tokens,较2025年末**实现翻倍增长** [1][15] * **文生视频业务增长突出**:以剪映(即梦)中的文生视频模型为例,日均消耗约**8万亿视觉Tokens**(算力成本远高于文本) [1][7] * **Coding Plan低价策略刺激**:该按调用次数计费、不限制Tokens的套餐价格极具吸引力,刺激了编程等场景的调用量 [1][8] * **用户不可见的后台计算**:平台统计的Token消耗远高于用户感知,因为计入了**在线检索网页内容、个性化与记忆机制**等后台处理环节的Tokens [9] 3. 盈利能力与定价策略 * **文生文业务**:在火山引擎上,基于成熟基模的文本推理服务**毛利率接近30%(约27-28%)** [1][17] * **文生视频业务**:**盈利能力因渠道分化** * **火山引擎渠道利润较高**:定价为平均**每秒1元**,设置高采购门槛(起充100万元或年消费1000万元大客户) [17][18] * **即梦平台目前不赚钱**:虽然单次生成有约20%以上毛利,但因提供免费积分策略,整体处于不赚钱状态 [1][17] * **Coding Plan**:已于2026年3月31日后停止,该计划定价约50元/月允许调用9万次且不限制Tokens,导致**巨亏** [17] 4. 算力储备与采购计划 * **当前算力存量**: * **英伟达芯片**:**H20最多(30-35万张)**;A系列(A100/A800)约12-13万张,是当前服务主力但将进入衰退期;**H系列(H100/H800)不足10万张,极度紧缺** [19] * **国产芯片**:**华为升腾910系列超10万张(约11-12万张)**;**寒武纪思元590系列超25万张**(尚未完全上架) [20] * **2026年采购计划**: * **国内采购**:计划采购**寒武纪590/690型号共计25万张以上**;采购**300套华为384超节点方案**(总计超10万颗芯片,初期为910B/C,后续转向950PR);增加**海光芯片采购(至少5万颗以上)** 作为备份 [21] * **海外采购**:预算**超1000亿人民币(可能达1200亿)**,采购型号包括英伟达**H200、B200及GB200** [1][21] 5. 2026年业绩目标与增长预期 * **云业务整体营收**:目标从2025年的220-250亿元增长至**超400亿元**,**同比增长60-70%以上** [2][22] * **AI云业务收入**:预期从2025年的50多亿元增长至2026年的**120亿元左右** [2][22] * **业务量目标**:对于MaaS、PaaS等成熟业务,要求实现**3到5倍增长**,其中MaaS和PaaS目标是**5倍** [2][22] * **Tokens调用量**:增长迅猛,最初设定的10倍增长目标已显保守;第二季度实际日均消耗量将远超此前预测的200万亿 [22] 其他重要内容 1. 市场竞争格局与火山引擎优势 * **企业采购市场份额**:截至2026年第一季度末,千问市场份额约25-30%,豆包约18%且缓慢上涨,其后是DeepSeek [7] * **火山引擎文生视频高定价的竞争优势**:**充足的合规高端算力(H100/H800)**、**短视频流量生态扶持**、**API综合价值高(可投流抖音、反哺即梦社区)**,形成生态闭环 [18] 2. 模型能力边界与应用案例 * **拍题解题应用**:大模型主要提升在于题目“标准化”处理,但**核心依赖大规模题库(讯飞、字节题库超1亿条)**;对于非数学类的复杂图文结合题,现有模型能力有限 [11] * **Agent应用(如“龙虾”项目)**:高峰时日活超200万,单用户日均消耗可超100万Tokens,但近期热度降温 [8] * **抖音直播间监控**:是内部Token消耗的重要场景,高危直播间监控消耗可达每分钟3万Tokens以上 [7] 3. 统计口径差异与数据解读 * **豆包与火山引擎数据差异**:源于豆包大模型可运行在非火山引擎平台(如私有化部署),这部分消耗计入豆包但不计入火山引擎 [14] * **Token消耗统计可能被夸大**:存在将主要消耗CPU的任务(如在线检索的网页预处理)计入Token总量的现象 [10] * **豆包APP日活口径**:净日活用户接近1.1亿(1.07-1.08亿),仅统计通过官方客户端访问的用户,不包含在头条等应用内调用的用户 [16]