MaaS(模型即服务)
搜索文档
智谱挂牌上市,ARR年化收入超5亿,实现25倍增幅
格隆汇· 2026-01-08 10:09
公司上市与市场表现 - 智谱于1月8日在港交所上市,股票代码2513.HK,首日开盘涨3.27%报120港元/股,市值一度超过528亿港元 [1] 公司行业地位与商业模式 - 公司是中国最大的独立大模型厂商 [1] - 商业模式未走重交付、强定制的传统企业AI路线,而是形成了以MaaS(模型即服务)为核心的标准化产品体系 [1] - 通过API调用、模型订阅及本地化部署等方式,向企业及开发者交付“通用智能能力”,而非单一场景应用 [1] 平台运营与客户规模 - 智谱MaaS平台已汇聚超过300万家企业及应用开发者,是国内最活跃的大模型API平台之一 [1] 产品表现与收入增长 - 编程订阅产品上线短时间内即实现过亿的年度经常性收入(ARR) [1] - GLM-4.7发布后,智谱MaaS ARR年化收入从2000万增至超5亿,10个月斩获25倍增幅 [1] - 2025年智谱全年MaaS同比增速超900%,幂次增长态势显著优于海外龙头同期表现 [1] 市场拓展 - 编程订阅产品在海外开发者社群中快速渗透 [1]
盘点2025:模型服务,成为基础设施
第一财经· 2025-12-30 18:15
全球MaaS市场格局与火山引擎的崛起 - 截至2025年10月,全球MaaS市场前三名为OpenAI、谷歌云、火山引擎,市场份额分别为31%、19%、15%,三家合计占据全球市场65%的份额[1] - 火山引擎以30万亿日均Tokens调用量位居全球第三,仅次于OpenAI的70万亿和谷歌云的43万亿[3] - 火山引擎是前三名中唯一的中国厂商,正凭借MaaS服务在AI云市场快速突围[3] 火山引擎的增长与市场地位 - 2025年,火山引擎实现100%的同比增长,营收超过200亿人民币[6] - 由于MaaS商业化和模型迭代超预期,公司原计划于2030年实现的1000亿营收目标被上调了百分之几十[6] - 2025年上半年,火山引擎在中国公有云大模型服务市场份额扩大至49.2%,意味着中国公有云上每产生两个tokens就有一个由其生产[14] - 在Gartner 2025年度全球《AI应用开发平台魔力象限》中,火山引擎领跑“挑战者”象限,其“执行能力”位列全球第五、中国第一[14] 关键增长驱动与战略举措 - 2024年5月15日,火山引擎推出豆包大模型API服务,通过技术创新将主力模型定价从“分计价”拉入“厘计价”时代,降幅高达99.3%,引发了行业降价潮并推动了市场“从无到有”般的增长[6] - 2025年2月1日,DeepSeek-R1登陆火山方舟,模型推理服务全面爆发,火山引擎成为市场上吃到最多DeepSeek推理服务红利的云厂商[7] - 豆包大模型与DeepSeek的爆红,共同催生了中国MaaS市场,IDC报告显示2024年7月和2025年2月是中国公有云大模型调用量月度环比增长率最高的两个拐点[8][10] - 豆包大模型调用量呈指数增长,推出不到600天,其最新日均调用量已达63万亿Tokens[3][4] 产品迭代与调用量增长的正循环 - 2025年6月以来,豆包大模型家族密集发布了1.6、1.8版本以及视频生成、图像编辑、语音、图像创作等多个模型,每次模型能力提升都解锁了更多应用场景并带动调用量增长[10] - 伴随模型发布节奏,几乎每3个月模型调用就会迎来一次更陡峭的增长[11] - 公司认为,大的模型调用量能打磨出更好的模型和基础设施,来自B端场景的真实反馈可以指导下一代模型的训练路线图[15][16][18] - 大规模调用量能迭代出更极致的基础设施,优化推理成本,例如通过PD分离、xLLM推理框架等方式在2024年5月大幅降低模型推理价格[18] - MaaS服务已成为火山引擎增长最快、毛利最高的AI云计算产品,参照DeepSeek公布的推理服务最高成本利润率可达545%[18] 字节跳动的技术溢出与协同优势 - 火山引擎63万亿日均Tokens调用量的用户基础,部分来源于字节跳动的溢出效应[20] - 公司受益于B端和C端的极致协同,字节跳动的C端产品(如豆包App)拥有大量用户并大规模调用模型,这帮助火山引擎优化服务,同时豆包App也成为向企业客户展示能力的窗口[20][21] - 字节跳动内部50多个业务线在AI实践上走得更靠前,尝试了众多Agent,这为火山引擎提供了宝贵的认知和know-how[23] - 云计算是规模体系的比拼,火山引擎的崛起得益于字节跳动庞大的业务体系托举和技术外溢,这与AWS、谷歌、阿里等头部云厂商的路径类似[24] - 字节跳动通过火山引擎持续把新模型、新技术开放给企业客户,以在更大市场经受检验[24][25] 未来战略:从MaaS到AI云原生 - 在取得MaaS份额第一后,火山引擎的战略目标依旧是MaaS优先[27] - 公司致力于降低AI应用门槛,通过更高层次的封装和成本优化加速AI普惠[27] - 在基础MaaS层,追求模型效果更好、成本更低、易用性更高,并推出了Prompt Pilot、Model Router和Responses API等工具[27] - 在更底层,推出了模型的推理代工服务,客户可将自己的模型托管在火山方舟上,无需自建基础设施[27] - 随着应用迈向以Agent为技术主体,公司正构建以模型为中心的AI云原生架构,MaaS是使用模型的最佳方式,云平台和中间件进一步把Tokens组装成Agents[28] - 作为国内率先推出Agent开发、运营全套产品的云厂商,火山引擎已将豆包助手API、即梦API对外提供服务[30] - Agent的商业逻辑从tokens调用的IT预算,转向类似BPO(人力外包)的角度,市场天花板有望扩大很多倍[30]
代表字节跳动上春晚的,怎么是火山引擎?
财联社· 2025-12-30 15:24
火山引擎成为2026年央视春晚独家AI云合作伙伴 - 字节跳动旗下AI云服务火山引擎正式成为2026年央视春晚独家AI云合作伙伴,这是春晚合作首次由ToB业务线承载[1] - 与往年不同,此次合作并非由抖音等C端产品冠名,而是字节内部经过讨论后主动选择以火山引擎品牌进行合作[6] - 合作公布后,火山引擎透露其已支持抖音历年春晚直播,并在2021年保障了抖音春晚703亿次红包互动[9] 火山引擎的业务表现与市场地位 - 火山引擎在2024年突飞猛进,其FORCE原动力大会现场有5000人挤在会场,上万人涌入活动场地[3] - 在AI调用量上,火山引擎保持国内第一并高速增长,豆包大模型Tokens日均调用量在12月从超过50万亿攀升至63万亿[3] - 火山引擎在中国公有云大模型市场份额已接近50%,是字节跳动增长最迅猛的业务之一,Token调用量近乎线性增长[14] 豆包App的市场表现与定位 - 第三方机构数据显示,豆包App的日活跃用户数已突破一亿[5] - 在用户感知层面,豆包App已被广泛使用,被视为与微信、支付宝、抖音同级别的产品[5] - 在字节跳动的定位中,豆包是火山引擎的一个最佳实践,用于展示火山引擎的底层能力[8] 字节跳动的战略意图与行业判断 - 此次合作旨在向全民市场传达字节跳动真正的AI战略,即突出其底层模型和基础设施能力[6][9] - 公司高层预判科技公司需要突破业务惯性去探索,而火山引擎所代表的底层基础设施是字节跳动成为科技公司的重要要素[13] - 公司认为AI时代的竞争方式已变,模型性能直接成为用户体验的关键,未来AI消费将以个体对模型的体验为核心,用户在无意识中选择模型、云和算力[8] “Powered by 火山引擎”的品牌战略 - 字节跳动试图将“Powered by 火山引擎”打造为AI时代的“成分品牌”,类似于“Intel Inside”或“宁德时代 Inside”,让一个B端品牌直接触及C端用户[16] - 通过春晚这一国民级舞台,公司希望将“Powered by 火山引擎”与“扛得住泼天流量”、“最聪明的AI体验”划上等号,在未来为开发者提供直接转化的用户信任感[17] - 这标志着字节跳动希望“Powered by 火山引擎”成为公司新的最重要印记,并让公众重新理解这家正在变化的公司[17] AI行业竞争态势的变化 - AI应用的竞争方式已与移动互联网时期不同,模型与产品的界限继续模糊[8] - 国内AI类产品中,日活过亿的并不多,而春晚合作对平台日活曾有必须过亿的要求[9] - 大模型的AI风口让字节跳动内部一系列技术积累得以释放,此次风口是为未来数十年至关重要的技术提供底座,而非单一应用成为国民级应用[14]
一边亏一边冲!智谱MiniMax抢IPO,大模型赚钱难为何还扎堆上市?
搜狐财经· 2025-12-24 16:21
文章核心观点 - 智谱与MiniMax竞相冲刺港股IPO 标志着中国大模型行业从技术竞赛阶段迈入资本考验新阶段 上市融资以支持研发的同时 也需面对持续盈利的终极挑战 [1][13] 公司概况与财务表现 - 智谱2022年至2024年营收从5740万元人民币飙升至3.124亿元人民币 年复合增长率达130% 预计2025年营收能再翻一倍 [5] - 公司2024年净亏损29.58亿元人民币 2025年上半年净亏损23.58亿元人民币 研发开支是同期收入的8倍多 招股书中未提供明确的盈利时间表 [11] 竞争优势与股东背景 - 公司股东阵容豪华 包括高瓴、红杉等顶级风投以及腾讯、阿里、美团等互联网大厂 [5] - 北京、上海等多地国资入股 为其在获取政府和国企订单时带来显著优势 [7] - 公司正从为重资产(如为政府和大企业做本地化部署)向轻资产的MaaS(模型即服务)模式转型 后者通过API调用 具备指数级增长的潜力 [7] 行业挑战与竞争格局 - 算力成本高昂 算力服务费占研发开支的70%以上 严重挤占了技术升级和吸引顶尖人才的资源 [9] - 全球高端芯片供应不稳定及美国制裁 直接威胁到模型迭代的生存与发展 [11] - 竞争对手MiniMax同样在筹备IPO 预计2026年1月挂牌 两者在资本市场展开激烈竞速 [9] 上市意义与行业阶段 - 智谱与MiniMax竞逐港股大模型第一股 乃至全球基座大模型第一股 旨在抢占资本市场先发红利 [3] - 行业此前依赖讲故事融资 上市后将面临定期的业绩考核 实现真金白银的盈利成为硬性要求 [13] - 上市是公司“补血”以持续投入研发的关键机会 但同时也需接受更严格的市场考验 [13]
全球大模型第一股之争:中国AI,到底该先造底座还是卖爆款?
36氪· 2025-12-23 18:23
行业格局与公司定位 - 中国大模型领域两家“独角兽”公司智谱与MiniMax在48小时内先后申请港股上市,引发“全球大模型第一股”的讨论 [1] - 两家公司代表了AI产业发展的两种不同路径:智谱是向下扎根的“基建派”,旨在成为AI时代的“水电煤”;MiniMax是向上生长的“应用派”,致力于制造更炫酷的“电器” [1] - 智谱的起点是清华大学实验室,坚持全栈自研GLM架构,目标是从零编写AI时代的“操作系统”,成为通过API向企业供给底层能力的“发电厂” [2] - MiniMax的路径几乎完全相反,选择先做出能被用户直接感知的爆款产品,战略重心在于将技术快速转化为应用层产品 [4] - 智谱试图构建定义AI时代底层规则的“基建系统”;MiniMax更希望成为在具体应用场景中占领用户心智的“垂直电器品牌” [7] 智谱AI:商业模式与运营数据 - 公司商业模式以B端和G端为核心,全部收入来自通过MaaS平台提供大模型服务 [9] - 2024年全年收入达到2.63亿元人民币,2025年前6个月收入1.62亿元人民币,根据往年130%的年复合增长率计算,2025年全年收入将在7.18亿以上 [9] - 自2024年起海外客户开始产生收入,到2025年上半年,海外客户贡献的营收占比达到11.6% [10] - 收入结构以本地化部署为主,2025年上半年本地化部署收入占比84.8%,云端部署收入占比15.2% [11] - 商业模式具有高粘性和可持续性,政企客户替换成本高,年复购率达到79% [12] - 公司毛利率表现强劲,自2022年至2025年上半年基本维持在50%以上 [12] - AI编程订阅制产品上线仅两个月,年度经常性收入便突破亿元人民币 [13] - 截至2025年9月末,公司模型已赋能全球1.2万家企业客户、覆盖逾8000万台终端,平台上聚集超270万企业及应用开发者,并对接超4500万开发者生态 [14] - 2025年11月,公司日均token消耗量为4.2万亿 [14] MiniMax:商业模式与运营数据 - 公司商业模式聚焦C端订阅与应用内购买,通过爆款应用快速获取用户与现金流 [15] - 2025年前9个月,总收入为5344万美元,其中应用相关收入达到3802万美元,占总收入的71.1% [15][16] - 营收超7成来自于to C产品,其中海螺AI和Talkie/星野两款应用合计占据了总营收的67.7% [6] - 公司毛利率较低,2023年至今从未超过25%,2024年毛利率低至12.2% [18] - 低毛利率与高昂的营销投入有关,2024年公司营销开支是其营收的2.8倍,达到8700万美元 [18] - 但公司的B端业务毛利率表现突出,高达69.4%,而同期C端业务毛利率仅为4.7% [20] - 根据招股书数据计算,B端拥有2.5万付费企业客户,平均每家企业一年贡献约4.5万元人民币 [22] - C端用户付费水平各异:语言模型付费用户人均年贡献约530元;海螺视频付费用户人均年贡献约400元;Talkie/星野付费用户人均年贡献约36元 [22] 财务表现与成本结构 - 2025年上半年智谱亏损17.52亿元人民币,MiniMax在2025年1-9月亏损约5.12亿美元 [21] - 行业面临的核心问题是如何将算力成本转化为收入与毛利,即算力的“回报率” [21] - MiniMax在2025年1-9月的研发总开支中,有77%支付给算力供应商;智谱的这一比例为71.8% [22] - 行业存在成本结构刚性的挑战,目前是“每花出去3块钱的算力成本,只能从市场上收回来1块钱”的昂贵“烧钱换增长”模式 [23] 长期价值与产业思考 - 技术产业演进史表明,真正沉淀长期价值的往往是定义底层标准与生态的“根技术”提供者,而非阶段性的现象级应用 [23][25] - 在PC时代是微软的操作系统;在移动互联网时代是iOS与Android;在云计算浪潮中是AWS、Azure等基础服务商 [23] - 大模型行业仍处早期,底层能力的跃迁会重构上层应用形态,应用层的优势可能因基座技术跃迁而被迅速抹平 [24] - 应用层竞争将不可避免地走向同质化与免费化,长期盈利能力存在结构性不确定 [24] - 字节跳动、腾讯、阿里等巨头拥有成熟的产品能力和庞大流量,应用层创新者容易被复制和整合 [25] - 决定企业最终价值的是底层技术的不可替代性、商业模式的长期稳定性以及在产业生态中所处的位置 [27]
AI大模型独角兽招股书深度拆解:MiniMax to C,智谱 to B
华尔街见闻· 2025-12-22 11:57
事件概览 - 中国大模型领域两家独角兽公司智谱AI与MiniMax在48小时内相继向港交所递交招股书,展示了截然不同的商业化路径与技术底色 [1] 商业模式与收入结构 MiniMax:C端驱动,押注AI原生超级应用 - 商业模式更接近互联网产品公司,核心为“AI原生产品”,该板块收入从2023年的75.8万美元飙升至2025年前9个月的3802万美元,占总收入的71.1% [3][4] - 核心产品Talkie/星野通过用户与虚拟角色深度互动构建粘性,变现模式包括订阅、虚拟物品内购及在线营销服务 [5] - 用户规模井喷,平均月活跃用户从2023年的310万增长至2025年9月的2760万,累计服务超2亿用户;付费用户数在2025年前9个月达177.16万,每位付费用户平均支出从2023年的6美元提升至15美元 [4][5] - 同时,B端企业服务业务(开放平台)在2025年前9个月贡献了28.9%的收入,且毛利率高达69.4%,显示强大的技术溢价能力 [4][7][18] - 公司高度全球化,2025年前9个月来自中国内地的收入仅占26.9%,美国市场占20.4%,其他海外地区占比较高 [30] 智谱AI:B端为王,深耕本地化部署 - 商业模式为典型的企业级服务,围绕MaaS平台构建商业版图 [8][9] - 收入高度依赖本地化(私有化)部署,截至2025年6月30日,该部分收入达1.62亿元人民币,占总收入比例高达84.8% [10][11] - 主要服务于对数据安全和私有化有刚性需求的央国企及大型机构,截至2025年6月30日已为超过8000家机构客户提供服务 [11] - 公司主要聚焦国内市场,2025年上半年海外收入(主要为东南亚)占比为11.1% [11][30] 技术路线与产品 MiniMax:强调全模态能力 - 模型矩阵涵盖文本、语音、视频及音乐,其视频生成模型Hailuo-02在独立测评中位居全球前列 [13] - 语音模型Speech-02被公认为全球顶尖,为数字阅读与IP开发巨头(如阅文集团)等提供底层技术支持,是大量有声书、播客AI伴读/配音功能的提供商 [7] - 采用专有的MoE架构及线性注意力机制,旨在降低推理成本,支撑C端大规模应用 [13] 智谱AI:强调学术底蕴与GLM框架 - 源自清华大学知识工程实验室,2020年启动GLM预训练框架开发 [15] - 技术亮点包括GLM-4.5基座模型及AutoGLM智能体,后者能模拟人类操作设备,实现从“对话”到“执行”的跨越 [15] - GLM系列模型在开源社区累计下载量超4500万次 [11] - 技术定位强调“安全”与“可控”,与服务大型企业和公共部门的定位高度契合 [15] 财务表现与盈利能力 MiniMax:C端变现提速,毛利率显著改善 - 整体毛利率从2023年的-24.7%改善至2024年的12.2%,并进一步提升至2025年前9个月的23.3% [18] - B端“开放平台及其他企业服务”业务在2025年前9个月毛利率高达69.4%,远超行业平均水平 [18] - 营收增长迅猛,从2023年的3460万美元增长至2025年前三季度(截至9月30日)的5344万美元 [18] 智谱AI:B端稳健增长,但云端业务承压 - 收入从2022年的5741万元人民币增长至2024年的3.12亿元人民币,复合年增长率超过130%;2025年上半年营收为1.91亿元人民币 [20] - 整体毛利率保持在50%的较高水平,主要得益于本地化部署业务高达59.1%的毛利率 [20] - 云端部署业务毛利率从2022年的76.1%大幅下滑至2025年上半年的-0.4%,出现毛利亏损,主要由于顺应市场趋势降低服务价格,反映API市场价格战激烈 [20] 研发投入与经营效率 智谱AI:超饱和研发投入 - 2025年上半年,营收1.91亿元人民币,同期研发开支高达15.95亿元人民币,研发费用率高达835.4% [25][26] - 研发投入主要用于算力服务费及研发人员薪酬,显示追赶顶尖模型能力的决心 [25] MiniMax:研发效率提升,费用率快速收敛 - 2023年研发费用率超过2000%,但到2025年前9个月已降至337.4%(研发支出1.8亿美元 vs 营收0.53亿美元) [27][28] - 随着C端产品放量,公司正逐步摊薄巨额研发成本,经营杠杆效应开始显现 [27] 股东背景 MiniMax:获互联网及游戏巨头支持 - 创始人闫俊杰博士通过投票权架构控制公司,股东包括阿里(持股约13.66%)、腾讯(持股约2.58%)及游戏公司米哈游(持股超5%) [32] 智谱AI:股东结构多元,兼具市场与国资背景 - 股东包括蚂蚁集团、腾讯、美团、小米等互联网巨头,以及社保基金中关村创新基金、北京市人工智能产业投资基金等国资平台,还有高瓴、君联资本等老牌VC [33] 资金状况与行业意义 - MiniMax账上现金及金融资产合计约10亿美元,智谱AI现金及现金等价物达25.5亿元人民币,短期内均有充足资金支持技术长跑 [34] - 两家公司递表标志着中国AI行业从“百模大战”进入商业化落地的深水区,向资本市场呈现了“AI原生超级应用”与“AI新基建”两种不同的商业叙事 [34]
全球大模型第一股智谱的“冰火两重天”
观察者网· 2025-12-20 16:11
公司概况与市场地位 - 公司于2025年12月19日正式向港交所递交招股书,有望成为“全球大模型第一股”,标志着中国大模型赛道迈入资本化新阶段 [1] - 公司成立于2019年,由清华大学知识工程实验室技术成果转化而来,创始团队背景深厚 [2] - 成立至今已完成超8轮融资,累计融资超83亿元人民币,投资方包括美团、蚂蚁、阿里、腾讯、小米等产业资本及红杉、高瓴等一线机构 [3] 财务表现与增长 - 收入高速增长:2022年、2023年、2024年收入分别为0.57亿元、1.25亿元、3.12亿元人民币;2025年上半年收入达1.9亿元,同比增长325% [1] - 亏损主要源于研发投入:2022年、2023年、2024年经调整净亏损分别为0.97亿、6.21亿、24.66亿元人民币;2025年上半年经调整净亏损17.51亿元 [1][11] - 毛利率保持高位:2022年至2024年毛利率分别为54.6%、64.6%、56.3%;2025年上半年毛利率为50%,始终维持在50%以上 [9] 商业模式与客户基础 - 核心商业模式为MaaS(模型即服务),通过将算法封装为标准化产品解决企业AI落地问题,而非单纯交付模型 [8] - 模型已应用于金融、工业制造、能源电力等20多个关键行业 [8] - 截至2025年9月30日,公司GLM模型拥有全球12000家企业客户、逾8000万台终端用户设备及超4500万名开发者,是中国赋能终端设备最多的独立通用大模型厂商 [8] - 截至2025年9月30日止九个月,公司拥有超过12000名机构客户,较截至6月30日止六个月大幅增加 [8] 研发投入与成本结构 - 研发开支是亏损主因:2024年全年研发开支高达21.95亿元,占当年亏损绝大部分;2025年上半年研发开支为15.95亿元 [11] - 研发成本中算力服务费占主导:2024年21.95亿研发支出中,算力成本达15.53亿元,占比70.7%;2025年上半年算力成本为11.45亿元,占比71.8% [12] - 研发团队规模为657人,2024年工资成本为3.24亿元 [12] 技术能力与产品迭代 - 模型能力覆盖广泛,涵盖语言、多模态视频、代码模型、GUI智能体和计算机应用,覆盖广度高于表格中列出的其他竞争对手 [14] - 模型快速迭代:GLM系列模型每3-6个月完成一次基座迭代 [15] - 2025年7月推出的GLM-4.5/4.6模型在12项权威评测中综合排名国内第一、全球开源第一,其Coding能力在Code Arena上与Anthropic、OpenAI模型并列全球第一 [15] 市场环境与竞争格局 - 以2024年收入计,公司是中国最大的独立大模型厂商,市场份额为6.6%,在中国头部大语言模型厂商中排名第二 [5][6] - 2024年中国大语言模型市场规模约53亿元,其中机构客户贡献47亿元,个人客户仅6亿元;预计到2030年,企业级市场规模将达到904亿元,占比高达90% [17] - 中国市场以B端为主导,与美国市场以C端订阅(如OpenAI约75%收入来自消费者订阅)为主形成鲜明对比 [17] 战略方向与未来看点 - 公司战略坚持投入基座模型研发,认为这是未来获取更高商业天花板的基础,当前亏损被视为换取“算力入场券”的战略性投入 [16] - 为应对“模型贬值”趋势,公司加速推进以API收入为主的MaaS战略,从卖项目转向卖Token消耗,2025年11月日均token消耗量达4.2万亿 [8][19] - 在智能体(Agent)领域,公司开源的AutoGLM成为手机厂商对抗互联网巨头的“第二选择”,正试图嵌入海量终端设备 [20] - 截至2025年10月31日,公司持有的现金及现金等价物、短期投资及可动用银行融资共计89.43亿元,为持续研发提供资金缓冲 [20]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:55
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍[1] - 在MaaS(模型即服务)市场,火山引擎已成为国内市场份额第一,全球排名第三[2] - 公司营收规模快速增长,2024年营收超过110亿元,增速远超60%;2025年营收已超过200亿元[6] 2025年AI市场核心趋势 - 多模态和Agent是2025年AI市场的关键趋势[3] - 视频生成模型的竞争焦点已从参数、时长转向能否直接产出“可发布的完整作品”,声画同步成为重要竞争因素[7][11] - 行业迭代速度极快,模型正从技术工具演变为具备社交平台潜力的创作工具[9][22] 火山引擎Force大会核心产品发布 - 模型侧发布豆包旗舰模型1.8和视频生成模型Seedance 1.5 pro[3] - 围绕Agent生态发布企业推理代工服务、强化学习平台、企业级AI Agent平台AgentKit以及HiAgent“1+N+X”智能体工作站[3] - 豆包大模型1.8采用集成策略,将LLM、VLM、Thinking等能力整合进单一模型接口,简化客户选择与集成流程[26][27] Seedance 1.5 pro视频模型的技术与商业突破 - 核心主打声画同步功能,可实现开箱即用,生成视频的嘴型匹配、情绪捕捉与画面配合度达到高可用水平[8][13] - 在中文适配、电影级运镜、动态张力及环境沉浸感方面表现突出,优于部分海外模型[13][14][15] - 通过多阶段蒸馏、量化等工程优化,模型端到端推理速度提升超过10倍,极大降低了生成成本[17][31] - 模型支持多种方言和强表演场景,适合生成可供二次创作的社交内容,与豆包、即梦等C端产品联动潜力大[21][22] 火山引擎的AI发展战略与系统工程 - 公司定位为AI Native,其基础设施、产品架构及商业模式均围绕AI云原生设计,视AI为弯道超车的关键[34] - 竞争已从模型能力比拼转向系统工程较量,重点解决企业“用不起来”的问题,涉及数据接入、任务编排、效果评估等[35] - 同步建设模型的“脑”(豆包大模型)与“手”(AgentKit),旨在降低开发门槛,提供从开发到运营的闭环解决方案[37] - 演示中企业级电商客服Agent从搭建到上线用时不足半小时,展现了效率的飞跃[38] 商业模式与成本优化创新 - 推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本[32] - 探索按“智能”交付物价值或按思考长度分段付费等新型计费模式,超越单纯的Token计费[33] - 通过工程优化不断提升MaaS服务“密度”,即在同等成本下提供更多价值[30][31] 市场渗透现状与未来展望 - 国内大约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高,头部效应明显[24][25] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍[24] - 公司目标是构建完整的AI基础设施和服务体系,让每个企业都能低门槛、低成本地使用先进AI能力[38]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:31
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 2025年日均token使用量为16.4万亿 [4] - 火山引擎在MaaS(模型即服务)市场已成为国内份额第一,全球排名第三 [4] - 公司2024年营收规模超过110亿元,增速远超60%;2025年营收已超过200亿元 [8] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍 [36] 大模型发展趋势:从单点能力到系统工程 - 大模型竞争已从单点能力较量进入系统工程的较量 [2] - 行业头部效应明显,约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高 [36][37] - 公司提出在模型上做“减法”,将LLM、VLM、Thinking等所有模型能力集成进一个API接口,降低客户选择与集成复杂度 [38] - 模型能力的集成对基础模型要求更高,需要领先的基模作为支撑 [39] - 基础模型的能力直接决定下游应用天花板,例如豆包基础模型支撑了Seedance在语义理解、情感识别等方面的细致表现 [40][41] 视频生成模型的竞争维度与进展 - 2025年视频模型竞争焦点从卷参数、秒数,转向能否直接产出“可发布的完整作品” [10] - “声画同出”(声画同步)成为关键竞争因素,是客户的核心诉求之一 [15][28] - 火山引擎发布的视频生成模型Seedance 1.5 pro主打声画同步、开箱即用 [11] - 该模型在中文对口型匹配度、声音与人物环境适配度、沉浸感方面表现突出 [18][19] - 模型强化了对电影级运镜和动态张力的遵循,动作幅度及多镜头、多主体呈现高于行业水平 [20][25] - 通过多阶段蒸馏、量化等工程优化,Seedance 1.5 pro的端到端推理速度提升超过10倍,降低了生成成本 [28][46] Agent(智能体)工具链与生态建设 - 公司重点发布围绕Agent的工具链和生态服务,包括企业模型推理代工、强化学习平台、企业级AI Agent平台AgentKit及智能体工作站HiAgent [6] - AgentKit旨在降低开发者门槛,封装prompt工程、工具调用等底层能力,让开发者聚焦业务逻辑,并提供从创建、测试、部署到监控的完整运营闭环 [53] - 公司自身在客服、内容审核等业务中积累了Agent实践经验,并通过AgentKit对外输出 [53] - 演示案例显示,从零搭建并上线一个企业级电商客服Agent用时不到半小时 [54] - 公司目标是让每个企业都能拥有自己的AI助手,构建完整的AI基础设施和服务体系 [54] 商业化、工程优化与计费创新 - 行业通过工程优化提升MaaS服务“密度”,即在同等成本下提供更多价值 [45] - 公司推出“AI节省计划”计费模式,通过阶梯式折扣,帮助企业最高节省47%的成本 [47] - 公司认为未来计费方式不应仅按Token,而可能按交付的“智能”或思考长度分段付费 [47][48] - 公司从成立起就围绕AI云原生设计基础设施、产品架构和商业模式,将AI视为弯道超车的关键 [49][50] - AI基础设施竞争已演变为系统工程的较量,企业需要解决数据接入、任务编排、效果评估、成本控制等系列问题 [51] 内容生态与模型应用潜力 - Seedance 1.5 pro支持方言、对白和强表演场景,适合在豆包、即梦等C端产品中生成可供二次创作和分享的内容 [32] - 公司对“什么内容能火”的理解已转化为模型的训练目标 [33] - 随着视频生成模型成熟,AI生产视频将与C端产品联动,模型不仅作为技术工具,更具备演变为社交平台的潜力 [33]
豆包升级1.8 对话谭待:模型间最重要的不是竞争而是做大市场
贝壳财经· 2025-12-19 17:20
豆包大模型业务进展与数据 - 截至今年12月,豆包大模型的日均tokens调用量已超过50万亿,相比去年12月实现了超过十倍的增速 [1] - 火山引擎宣布将豆包大模型升级至1.8版本,面向多模态、Agent(智能体)等场景进行定向优化 [1] - 豆包APP在月活数据上断层领先其他AI行业应用,坐稳C端应用领先地位 [4] 模型能力升级与产品应用 - 豆包1.8模型在Agent能力方面实现大幅增强,包括Tool Use(工具使用)能力、复杂指令遵循能力及OS Agent(操作系统智能体)能力 [2] - 模型展示了执行复杂任务的能力,例如规划流程、理解屏幕、调用工具进行全网比价选购耳机 [2] - 豆包1.8展示了长视频理解能力,例如通过1小时4分钟的监控画面定位事件,该能力可应用于在线教育、安全巡检、产品质检等企业场景以提升效率、降低成本 [3] - 豆包底层是一套复杂的Agent系统,内部开发了大量Agent以处理不同领域的问题,如垂直搜索、开放性问题和闭环任务 [3] - 火山引擎正式发布豆包视频生成模型Seedance 1.5 pro,在“音画同步”能力上表现更强,声称可做到中文讲方言都音画同步 [4] 市场竞争格局与动态 - 阿里高调进军C端AI应用市场,旗下APP千问自11月17日公测仅23天月活跃用户数突破3000万,灵光上线4天下载量突破百万且增速超过ChatGPT和Sora2,蚂蚁阿福在品牌升级后隔日冲上苹果应用总榜第三 [4] - 在云市场,火山引擎与阿里云均宣称市场份额领先,双方广告牌在机场“隔空对峙”,数据差异源于统计口径不同:火山引擎引用MaaS层外部客户Tokens调用量数据,阿里云引用包括全链条的数据 [1][5] - 公司认为模型厂商之间最核心的关系并非存量竞争,预测明年整个AI市场规模有望再增长十倍 [1][6] - 公司欢迎更多企业加入并重视MaaS,认为更多云厂商积极投入是市场走向成熟的积极信号,生态参与者共同做大基础层能加速上层AI应用落地 [6] 公司战略与行业观点 - 公司强调安全是重中之重,将安全放在第一位,认为“能力越强责任越大” [2] - 公司较早明确了持续强调模型能力与tokens规模的重要性,并通过技术优化大幅降低模型调用成本,降幅高达99%,同时保持健康毛利 [6] - 公司认为行业天花板很高,更多人加入能加速行业发展、AI落地及社会发展 [6]