Workflow
GLM模型
icon
搜索文档
大摩闭门会-中国AI大模型-新前沿
2026-04-26 21:04
纪要涉及的行业或公司 * **行业**:中国人工智能(AI)大模型行业 * **主要公司**:MiniMax、智谱AI、阿里巴巴(阿里云)、腾讯 核心观点与论据 **1. MiniMax 的单位经济效益与财务表现突出** * **单位经济效益领先**:以单个H800服务器计算,MiniMax每分钟收入达**1美元**,高于行业平均的**0.5美元**;每分钟成本低于**0.3美元**,与行业平均相当,这使得其服务器层面的贡献利润率超过**70%**[1][2] * **业务增长强劲**:自2026年2月以来,其API token调用量保持每周**10%至20%** 的增长,相当于过去两个月增长了**3到4倍**[2] * **收入与指引**:理论上其当前ARR(年度经常性收入)应略高于智谱AI公布的**2.5亿美元**,预计年底有能力达到**10亿美元**的ARR水平[1][2] * **市场结构**:海外收入占比超过**70%**,可直接向三大云厂商采购算力,具有显著优势[1][2] **2. 智谱AI的财务表现与上市计划** * **财务表现**:截至2026年3月底,其ARR已达到**2.5亿美元**,并给出了年底达到**10亿美元**ARR的指引[1][2] * **上市计划**:预计在2026年第三季度申报A股上市,并预计在2026年下半年完成[1][6] **3. 阿里巴巴(阿里云)的模型能力与宏大战略目标** * **模型能力**:其通义千问3.6版本在多个全球模型榜单上表现优异,超过了智谱GLM 5.1,Plus和Max版本为闭源模型[5] * **多模态进展**:发布了多模态视频生成模型“happy house”和世界模型“HappyOyster”,均在相关榜单上名列前茅[5] * **长期收入目标**:为“云+AI”业务设定了到2030或2031财年实现**1000亿美元**外部收入的长期目标,这较过去12个月约**1000亿人民币**的收入有近**7倍**的增长空间,对应未来五年约**44%** 的年复合增长率[5] * **盈利驱动**:Model-as-a-Service(MaaS)被视为主要增长动力和利润提升的关键,其**20%-40%** 的毛利率远高于IaaS业务的个位数水平,这将支撑阿里云长期EBITA利润率达到**20%** 的目标[1][5] **4. 腾讯的模型进展与战略侧重** * **模型进展**:发布了混元3.0 Preview模型,参数量低于**300 billion**,能力与智谱去年的GLM 4.7版本相当,略低于MiniMax的M2.7版本,但优于M2.5版本[1][5] * **未来计划**:计划在**2026年年底前**发布一个**万亿参数级别**的大模型[1][5] * **战略重点**:应用层面的突破,特别是AI Agent的应用,被认为是更关键的因素,预计相关应用将在**2026年第四季度**推出[1][5] **5. MiniMax 对AI赛道及多模态战略的观点** * **市场空间**:认为AI赛道的机会远不止于编码等单一场景,其天花板在于生产力与创造力价值的全面提升[3] * **战略路径**:创造力相关的市场空间需要通过多模态技术才能实现,这解释了公司从成立之初就坚持拥抱多模态模型战略的原因[4] 其他重要内容(关键催化剂与事件) **1. MiniMax 未来关键事件** * **指数纳入**:预计在**2026年6月8日**被纳入恒生综合指数和恒生科技指数[6] * **解禁压力**:在**2026年7月8日**,其IPO基石股东和部分Pre-IPO股东将解禁,届时流通盘可能增加超过**40%**[1][6] * **对冲措施**:为应对潜在抛售压力,公司预计将在解禁前发布下一代大版本模型**M3系列**,该系列将是全模态模型,参数量预计从目前的**200多B**提升至**数千亿乃至万亿级别**,并可能伴随显著提价;同时,也可能在解禁前更新其ARR数据并给出年底展望[1][6] * **港股通**:预计在**2026年8月6日**,作为一家同股不同权架构公司被纳入港股通[6] * **后续解禁**:**2026年9月3日**将有另一批PE股东解禁[6] **2. 智谱AI 未来关键事件** * **指数与港股通纳入**:同样预计在**2026年6月8日**被纳入恒生综合指数和恒生科技指数,并因其非WVR架构而有望同日进入港股通[6] * **模型迭代**:在第二季度,其GLM模型预计会有小版本迭代,可能从**5.1**升级至**5.5**[6] * **股东解禁**:**2026年7月7日**,其基石股东将解禁,预计增加的流通盘在**5%** 左右[1][6]
大摩闭门会:AI云服务、半导体及光通讯行业更新;_下周台积电业绩预览_
2026-04-13 14:12
行业与公司 * 本次电话会议纪要涉及的行业包括:AI云服务、半导体(含存储、逻辑芯片、晶圆代工)、光通讯(光模块)以及智能手机行业[1][2] * 涉及的公司包括:台积电、英伟达、谷歌、迈威尔、英特尔、三星、海力士、长鑫存储、华邦电、南亚科、赵毅、阿里巴巴、腾讯、百度、美团、智谱AI、MiniMax、华为、寒武纪、百度昆仑芯、平头哥、燧原科技等[2][4][7][12][13][17][19][20][21][22][30][32][33][34][35][43][44][46][49] 核心观点与论据 AI云服务与算力需求 * 中国AI发展的核心瓶颈在于**芯片(算力)供给不足**,而非需求端,互联网公司、云厂商和模型公司均表示若能获得更多芯片,AI相关收入可立即显著提升[13][14] * 阿里云给出五年后达到1100亿美元收入的远期目标,过去12个月收入约1000亿人民币,隐含年复合增长率约44%,公司对未来一两年实现40%以上的云增速有信心,但长期增长取决于芯片供给[15][16] * 模型公司(如智谱AI、MiniMax)收入增长迅猛,ARR已达2-3亿美元,并有望在年底达到10亿美元体量,但增长同样受限于算力,智谱AI甚至因算力不足暂停了部分Coding Claude计划的销售[16] * 各公司采取不同策略应对芯片短缺:**阿里巴巴**因旗下平头哥及较早的资本开支投入,在芯片获取上具有优势,预计云收入增长确定[17];**腾讯**相对落后,上半年仍处缺芯阶段,下半年将依赖燧原科技的定制芯片及采购华为、寒武纪、昆仑芯等国产芯片[18][19];模型公司如**MiniMax**和**智谱AI**已从主要使用英伟达芯片转向评估并多元化采用国产芯片[20] * 评估中国AI算力应全面看待,而非仅聚焦先进制程:在芯片层面(制程、先进封装、存储)中国落后,但在系统层级(服务器、网络、软件)与美国并驾齐驱,在基础设施(电力、数据中心、政策支持)方面甚至更强[28][29] * 国产AI芯片有能力通过集群配置满足中国推理侧的需求,相关供应链(如封测、晶圆厂)被看好[29][49] 光通讯(光模块)行业 * 对2026-2027年光模块需求展望**非常乐观**[4] * 市场对**CPO**(共封装光学)进展快于预期最初感到震惊,但分析认为CPO的快速发展不会对当前光模块行业需求产生大的颠覆性影响[4] * 光模块公司除研发传统可插拔式(如1.6T/3.2T)产品外,正积极拓展**NPO/SPO**(近封装光学/可插拔光学)等新一代技术,相关产品已在OFC展会上展示实际样品,从理念进入可试生产送样阶段[5][6] * NPO/SPO发展可能加速,预计明年上半年或出现商用案例,其发展与CPO呈“你追我赶”态势,甚至可能因CPO加速而触发NPO阵营发展[7] * 北美光通讯公司Arrest组建包含多家A股光模块公司的联盟推动SPU发展,被视为积极信号[7] 半导体行业(存储与逻辑) * **DDR4存储**:观点转为**谨慎**[30] * 过去12个月DDR4合约价上涨超过7倍,主要由供给端驱动(主流厂商为扩产AI用主流存储而减产DDR4)[31] * 供给端正发生重大变化:长鑫存储计划2027年将DDR4产能扩产至1万片/月(较当前约6000片翻倍以上),且2026年供给已有增长(赵毅2026年从长鑫采购DDR4金额预计达57亿人民币,同比增约5倍)[32][33];三星调整策略,二季度DDR4出货量或与一季度持平甚至略升,而非原计划的完全退出[34];利基厂商如华邦电、南亚科也计划扩产DDR4[35] * 需求端受高价抑制:手机(尤其是中低端机型)等消费端需求被摧毁,部分中小客户持观望态度;客户开始优化DRAM利用率以应对高价[36][37] * DDR4缺乏直接的强劲AI需求支撑,而主流DRAM有AI需求兜底[38] * **MLC NAND(利基型闪存)**:保持**乐观**[39] * 逻辑与DDR4类似,面临主流厂商减产,过去一年价格涨约5-6倍(以32G MLC合约价计)[39] * 但未看到类似的大规模扩产计划,且需求相对稳定[39] * **长期协议**:市场传闻有厂商与客户讨论LTA,固定价格的LTA难以达成,但若能以较高价格签署,将对利基型存储厂商形成支撑[40][41] * **台积电业绩预览**: * 预计一季度业绩与市场共识差异不大,季度营收增长个位数,毛利率超64%[43] * 智能手机需求疲软(砍单)已被网络通信和HPC(含CPO)需求弥补,预计全年指引不会下调,但上调可能性低,公司可能按兵不动[43] * 技术竞争关注点:英特尔EMIB技术可支持更大中介层尺寸是主流趋势;台积电若沿用CoWoS技术,一个晶圆仅能切出4颗芯片,会浪费约40%的面积,这可能影响其先进封装方案选择[44] * 资本开支:今年大幅上调不易,但明后年因SiC、HBM等需求强劲,台积电及其供应链仍被看好[45] * **谷歌TPU与迈威尔**: * 迈威尔与谷歌的战略合作非新鲜事[46] * 谷歌内部使用若纯粹为TPU,采用迈威尔方案更经济;若对外提供给云厂商客户并需要网络技术支持,则采用博通方案的几率高[47][48] * 目前预测未变:今年出货40万颗TPU(无延迟),明年250万颗(市场最高预测)[48] * ABF载板与迈威尔TPU的供应可能变得比较充足[49] 智能手机行业 * 现状呈现“冰火两重天”,与光模块的火热相对,手机市场寒意明显[3] * 内存价格持续上涨,已导致国内部分手机厂商官宣提价计划[8] * 手机OEM厂商的核心策略是通过提升ASP来部分抵消内存成本上涨和销量下滑的压力,目标是使收入跌幅较小(例如10%以内)甚至不跌[9] * 但大部分投资人认为该目标过于乐观,预期今年是手机市场极具挑战的一年,与上市公司观点存在**巨大预期差**[10] * 分歧焦点在于时间视角:上市公司基于当前运营数据看好,投资人则担忧未来数据变差,这一争论需要未来3-5个月的时间验证[11] * 台积电的智能手机芯片订单削减被视为利空出尽事件[12] 其他重要内容 * 阿里在AI以外,明确收缩本地生活(如外卖闪购)投资,并给出减亏指引:以2026财年为基准,未来两年每年亏损减半,目标在2029财年实现盈利[21] * 阿里本地生活业务减亏对**美团**有正面交叉影响,可能意味着外卖补贴竞争接近尾声,有助于美团盈利,预计其二季度本地商业板块、三季度外卖业务可实现盈利[22] * 模型公司收入结构差异:**智谱AI**收入90%来自国内,10%来自海外,且国内前十大互联网公司有九家接入其GLM模型[23][24];**MiniMax**则相反,海外收入占70%,国内占30%[25] * 尽管有阿里通义千问、小米等新模型出现,但国内及海外市场的token使用量增长依然非常快速,预计模型公司ARR将在未来几个月加速增长[26]
计算机行业周报:英伟达推出AVO智能体技术,Gemma4开启端侧智能新纪元-20260408
华鑫证券· 2026-04-08 22:15
报告行业投资评级 - 行业投资评级为“推荐(维持)” [1] 报告的核心观点 - 报告维持对AI应用板块的看好,认为头部模型公司已验证模型能力向商业价值的有效转化,随着行业从同质化接入转向依托强大基座的差异化落地,头部应用的盈利空间将被打开,业绩兑现与毛利改善的确定性将显著提升 [55] - 报告通过分析智谱的强劲财报、英伟达的AVO技术突破、谷歌Gemma 4的发布、中国大模型调用量领先以及AI算力基础设施的创新等动态,论证了AI产业持续快速发展的趋势 [3][13][15][22][33][42][55] 根据相关目录分别进行总结 算力动态 - **算力租赁与Token市场**:2026年3月30日至4月5日,周度Token调用量为27T,环比增长18.94% [13];中国AI大模型周调用量已连续五周超过美国,在3月30日-4月5日这一周达到12.96万亿Token,环比涨幅31.48%,是同期美国3.03万亿Token的4.28倍 [15];OpenRouter平台周Token消耗量榜单前六名均为中国模型,其中小米MiMo-V2-Pro周消耗量达4.19万亿Token,阿里Qwen3.6-Plus发布仅1天日调用量突破1.4万亿Token [15] - **市场份额**:在Token消耗市场份额中,qwen以39.6%的份额稳居首位,google以9.5%位列第二,OpenAI、Anthropic、Minimax分别占据8.8%、8.2%、7.3% [14] - **云服务定价**:国内云计算市场迎来大规模调价,阿里云、腾讯云、百度智能云等头部厂商相继上调AI算力等服务价格,部分产品涨幅最高超400% [20];火山引擎与京东云选择逆势保持价格稳定,京东云对部分PaaS产品推出专项优惠,平均降幅超16% [20] - **技术突破**:英伟达于2026年3月26日发布智能体式变异算子(AVO)技术,以自主编码智能体替代传统进化搜索方式 [22];在Blackwell B200 GPU上对注意力内核进行优化,实现1668 TFLOPS的吞吐量,较英伟达cuDNN库最高提升3.5%,较FlashAttention-4最高提升10.5% [28];该技术可快速迁移至GQA场景,性能较cuDNN最高提升7.0%,较FlashAttention-4最高提升9.3% [28] AI应用动态 - **流量跟踪**:2026年3月28日至4月3日,AI相关网站周访问量前三为ChatGPT(1254.0M)、Bing(812.9M)、Gemini(604.7M) [31];访问量环比增速第一为Discord,增长3.52% [31];平均停留时长前三为Character.AI(00:17:12)、Discord(00:10:54)、Kimi(00:08:16) [31] - **模型发布**:谷歌DeepMind于2026年4月3日发布开源模型系列Gemma 4,涵盖从2B到31B共四个尺寸,全部开源 [33];Gemma 4 31B Dense在Arena AI文本榜单上Elo评分达1452,位列开源第三 [34];相比前代Gemma 3,性能大幅提升,如在AIME 2026数学测试中成绩从21.2%提升至89.2%,在LiveCodeBench编程测试中从29.1%提升至80% [35] - **模型特性**:Gemma 4系列模型具备多模态能力,能处理图像、视频输入,其中E2B和E4B版本还兼容音频 [41];采用逐层嵌入、共享KV缓存、交替注意力机制等架构设计提升参数效率 [40];E2B和E4B版本针对端侧设备优化,可在手机等设备上离线运行,31B和26B版本面向工作站和服务器 [38] AI融资动向 - **主要融资事件**:太空数据中心企业Starcloud于2026年3月完成1.7亿美元A轮融资,估值达11亿美元,累计融资2亿美元 [2][42];资金将用于卫星研发、制造基地建设等 [2] - **公司进展**:Starcloud专注近地轨道太空数据中心,已成功将NVIDIA H100送入轨道并完成首次太空AI训练与轨道推理 [42];计划年内发射Starcloud-2,发电能力为初代100倍 [42] 投资建议 - **案例分析**:以智谱公司为例,其2025年全年实现总收入7.24亿人民币,同比增长131.9%,综合毛利率达41% [3][55];MaaS API平台实现ARR 17亿元(约2.5亿美金),同比提升60倍,毛利率同比提升近5倍至18.9% [3][55];企业级智能体业务收入增长248.8%至1.66亿元,开放平台及API业务增长292.6%至1.90亿元 [3];2026年一季度API提价83%后调用量仍保持增长 [55] - **关注公司**:报告中长期建议关注罗博特科(300757.SZ)、唯科科技(301196.SZ)、合合信息(688615.SH)、能科科技(603859.SH) [6][56];报告提供了上述公司的盈利预测与投资评级(均为“买入”) [8][58]
智谱(02513):25年云端业务表现亮眼,Coding驱动营收高增长
广发证券· 2026-04-02 14:46
报告投资评级 - 公司评级:增持 [4] - 当前价格:915.00港元 [4] - 合理价值:965.43港元 [4][21] 核心观点 - 2025年云端业务表现亮眼,Coding等场景驱动营收高速增长 [1][7] - MaaS平台破圈,API调用价格提升83%的同时,用户与付费Token仍保持快速增长,呈现量价齐升趋势,反映公司较强的定价权 [7][10] - 凭借GLM模型在AI辅助编程和Agent场景的突出能力,Coding Plan和Claw Plan用户快速增长及价格上调,有望驱动2026年营收再上台阶 [10] - 公司依托全栈式模型产品矩阵,构建本地化部署+云端服务双业务架构,B端与C端市场拓展均呈加速态势,预计亏损增幅将收窄 [14] 2025年财务表现与业务分析 - **整体业绩**:2025年主营业务收入7.24亿元(人民币,下同),同比增长131.9%;归母净利润为-46.98亿元,亏损同比扩大 [2][7][8] - **云端部署业务**:营收1.90亿元,同比增长292.6%,占总营收比重26%;毛利率为18.9%,同比提升15.6个百分点 [7][10] - **MaaS平台进展**:截至2026年3月,BigModel.cn平台注册用户突破400万;2026年第一季度付费Token消耗量增长4倍 [7][10] - **具体产品表现**:GLM Coding Plan的付费Tokens在6个月内增长15倍,付费开发者规模突破24.2万人;Claw Plan上线20天订阅用户突破40万 [10] - **研发投入**:2025年研发费用为31.80亿元,同比增长44.9%,研发费用率达439.1%,以保障模型竞争力 [10][12] - **盈利能力变化**:2025年整体毛利率为41.0%,较上年同期的56.3%下降15.3个百分点,主要受低毛利率云端业务占比提升影响 [11][12] 盈利预测与业务拆分 - **整体营收预测**:预计2026-2028年营收分别为20.85亿元、36.78亿元、58.35亿元,增速分别为187.8%、76.4%、58.6% [2][16][19] - **分业务预测**: - **本地化部署业务**:预计2026-2028年收入同比增长130%、60%、40%,毛利率稳定在50% [14][16] - **云端部署业务**:预计2026-2028年收入同比增长350%、100%、80%,毛利率预计提升至25%、27%、30% [15][16] - **利润与每股收益预测**:预计2026-2028年归母净利润分别为-37.37亿元、-36.29亿元、-33.18亿元;EPS分别为-8.49元、-8.24元、-7.54元 [2][19][22] - **费用率展望**:预计随着规模效应显现,研发、销售、管理费用率将显著下降 [19][20][22] 估值依据 - **估值方法**:采用市销率(PS)法进行估值,因行业处于高成长阶段 [21] - **可比公司**:选取商汤(2026年PS约10.5倍)和MiniMax(2026年PS约193.0倍)作为参考 [21][23] - **估值结论**:综合考虑公司AI基础能力、技术优势和行业地位,给予智谱2026年180倍PS估值,对应合理价值965.43港元/股 [21]
智谱一边狂奔,一边失血
虎嗅APP· 2026-04-01 10:18
公司财务表现 - 2025年全年实现总收入7.24亿元人民币,同比增长131.9% [4] - 2025年销售成本为4.27亿元,同比增长213.3% [4] - 2025年毛利为2.97亿元,同比增长68.7%,综合毛利率为41.0% [4] - 经调整净亏损额达到31.82亿元,亏损幅度同比增长29.1%,亏损额相当于总收入的4.39倍,毛利的10.7倍 [5] - 2025年研发成本为31.84亿元,同比增长44.9%,资本支出为7470万元 [5][24] - 2025年全年亏损47.18亿元,同比增长59.5% [24] 业务结构与盈利能力 - 收入构成呈现分化趋势,本地化部署业务毛利率由2024年的66.0%下降至2025年的48.8%,云端部署业务毛利率由2024年的3.3%上升至2025年的18.9% [4] - 云端部署业务(MaaS)占总收入比重从2024年的15.5%提升至2025年的26.3%,公司战略重点持续放在MaaS上 [13] - MaaS API平台实现年度经常性收入(ARR)17亿元(约2.5亿美元),同比提升60倍 [8] - 公司毛利率(41.0%)远高于另一家大模型上市企业MiniMax(25.4%) [4] 增长驱动与关键变量 - 2026年一季度业绩增长主要依赖于3月推出的AutoClaw(一键部署龙虾),API调用定价提升83%,但GLM模型调用量依然增长了400% [8] - AutoClaw上线两天后订阅用户破10万,上线20天后订阅用户突破40万 [8] - 增长核心驱动来自API调用量,其中龙虾(OpenClaw)是最直接变量,Agent应用导致单次需求对应多轮调用,Token消耗成倍放大 [15] - 十家互联网公司中已有九家接入智谱模型,这些公司的调用量占据了MaaS收入的半壁江山 [16] - MaaS增长还来自于Token“出海”,与多个中东和东南亚国家合作输出模型能力 [16] 行业对比与商业模式 - 与MiniMax对比,智谱总收入更高(7.24亿元 vs 5.4亿元),但研发投入(31.80亿元 vs 17.43亿元)和经调整净亏损(31.82亿元 vs 17.30亿元)也更高,人员规模是MiniMax的2倍(883人 vs 385人) [6][7] - 每赚1元收入,智谱亏损4.4元,MiniMax亏损3.2元 [7] - 大模型行业的商业模式开始收敛,除阶跃星辰外,智谱、MiniMax、月之暗面等基座模型公司核心收入都在向API调用(MaaS)收敛 [21] - 智谱早期业务以ToG与私有化部署为主,上市前约半年开始明显向MaaS转型 [21] 成本结构与行业困境 - 研发成本增长主要源于员工成本增加(包括扩大团队和股份支付)以及支付给第三方算力供应商的计算服务费用 [6] - 公司陷入结构性困境:为获得更多API调用需持续提升模型能力,而提升模型能力又必须不断加大研发与算力投入,导致收入增长的前提本身就在推高成本 [26][27] - 增长越快,成本压力越大,MaaS能够带来增长,但很难带来利润 [28][30] - 当前MaaS增长高度依赖少数互联网大厂客户,长尾市场尚未真正打开,平台形态已现但未建立起平台规模 [23] 战略对标与行业环境 - 智谱试图对标美国AI公司Anthropic的模式,即强调基座模型能力,通过API输出推理算力构建开发者生态 [33] - 中美市场环境存在差异:美国企业更愿为能力付费,中国经历了价格战,Token被迅速压低成为“基础资源”;美国生态依赖开发者长尾需求,中国调用更多集中在头部客户;国内算力供给、芯片结构及成本环境使得模型公司成本更难随规模下降 [35][37] - 基础设施层的盈利往往建立在应用层爆发之后,大模型公司需要等待应用场景被持续验证后才可能出现规模效应 [39] 新概念与指标 - 公司提出TAC(Token架构能力)概念,由智能调用量、智能质量和经济转化效率三部分构成,旨在解释当模型能力相差不大时增长的来源 [17][18] - 在“龙虾”事件后,行业形成共识:大模型具备长程任务执行能力后,调用被组织成持续运行的系统,Token被“编排”而不再只是被消耗 [17]
超预期!大模型第一股智谱交出首份“中国Anthropic”式财报
财联社· 2026-03-31 21:54
核心观点 - 智谱上市后首份年报验证了其MaaS(模型即服务)模式在中国市场的可行性,核心商业化指标已接近Anthropic水平,标志着公司已跑通商业闭环并具备定价权和自我造血能力 [1] 财务与商业化表现 - API业务年度经常性收入(ARR)达17亿元,过去一年提升60倍 [1] - 在行业价格战背景下,GLM模型API逆势涨价83%,调用量不降反升 [1] - MaaS API平台毛利率同比提升近5倍至18.9%,盈利能力大幅提升 [1] - 毛利润由2024年的17.59亿元增加至2025年的29.67亿元,增幅为68.7%,打破“增收不增利”的刻板印象 [4] - 收入结构发生质变,从早期“服务驱动”切换为“标准化API服务驱动”,API调用收入成为核心增长极 [7] 客户与市场地位 - 平台注册企业及用户突破400万,服务全球超过218个国家和地区 [1] - 中国前十大互联网公司中有9家使用GLM模型 [2] - GLM-5发布后24小时内,获得字节跳动、阿里巴巴、腾讯、美团、快手、百度及WPS Office等头部平台产品的官方接入,表明模型效果形成差异化优势 [2] - 涨价后API调用量不降反升且供不应求,揭示客户为效果付费的意愿强烈,模型智能上界决定定价权 [3] 技术与产品 - GLM-5在SWE-bench-Verified编程基准测试中以77.8%的得分位列开源模型第一,真实编程体验逼近Anthropic Claude Opus 4.5 [3] - 在全球模型评测平台Artificial Analysis综合能力榜单中位居全球第四、开源第一 [3] - 采用DeepSeek稀疏注意力机制和Multi-Token Prediction技术,总参数量达7440亿,激活参数约440亿,将长序列处理成本降低50% [6] - 推出AI编码工具订阅计划GLM Coding Plan(月费20元)和GLM Claw Plan,分别迅速积累超24万和40万付费用户 [5][6] 商业模式与战略对标 - 商业路径与Anthropic高度一致:以基座模型为核心壁垒,以API Token为主要产品形态,以开发者和企业级客户深度使用为增长引擎 [5] - Anthropic 60%至75%的收入来自API,并明确将编程作为核心用例 [5] - 智谱提出“Token架构力”新概念框架:TAC = 调用智能的量 × 智能的质量 × 转化为经济价值的效率,将自身定位为智能经济时代的基础设施提供商 [7][8] - 毛利率改善得益于模型推理效率的极致优化、高价值头部客户占比提升以及涨价带来的正向反馈 [3]
深度|MaaS竞争下半场,谁能掌握智能的定价权
Z Potentials· 2026-03-31 21:20
文章核心观点 - 国内MaaS(模型即服务)行业的竞争逻辑正在从单纯的价格战转向基于模型智能质量和任务完成能力的分层竞争,高质量、能深度融入企业工作流的智能服务开始获得定价权[2][7][13] 财务表现与业务信号 - 智谱公司2025年全年收入超过7.24亿元人民币,同比增长131.9%[2][4] - 全年综合毛利率达到41%[2] - MaaS API平台年度经常性收入(ARR)超过17亿元人民币,过去一年提升60倍[2] - MaaS API平台毛利率提升近5倍至18.9%[2] - 2025年第一季度API涨价83%后,调用量未降反增,增长了400%[2][7] - 公司年内亏损为47.18亿元人民币,经调整年净亏损为31.82亿元人民币[4] 行业竞争分层 - 第一类公司出售通用能力,核心是便宜、快速、覆盖广,类似“智能公用水电”,价格是主要竞争武器[5] - 第二类公司出售任务完成率和进入工作流后的可交付性,提供的是组织级工程能力,而不仅是一次模型输出[5][6] - 智谱的收入结构正从项目制和私有化交付,向标准化的、可累积的API服务收入切换[6] 定价权的来源与验证 - 定价权并非来自参数规模,而是由模型智能质量的上界决定,高质量的Token是稀缺资源[7] - 对于已将模型深度接入工作流的企业,模型效果带来的收益足以覆盖更高的Token成本[7] - 智谱通过一季度API提价83%而调用量激增400%的案例,验证了高质量智能服务具备定价权[7] 任务形态演进与价值创造 - 高价值场景从简单的问答、摘要转向跨步骤、跨工具、跨上下文的“长周期任务”[8][9] - 在编程领域,演进路径从局部提效工具,到Vibe Coding,再发展到要求模型能理解需求、拆任务、调用工具、编写测试的Agentic Engineering[9] - GLM系列模型的迭代方向是从知识导向转向任务导向,目标是让模型成为能处理长周期任务的“工程师”[9] - 在此背景下,Token的意义从算力消耗单位转变为智能劳动的计量方式,高质量Token消耗量因而快速增长[9] 商业化路径与市场拓展 - 智谱于2025年推出编程套餐“GLM Coding Plan”,付费开发者规模快速突破24.2万,Token调用量在6个月内增长15倍[10][11] - 2026年3月推出智能体套餐“Claw Plan”,上线两天订阅用户破10万,上线20天突破40万[11] - GLM模型已部署于Google Vertex AI、AWS Bedrock等全球顶尖云平台,并成为OpenRouter付费模型排名第一[11] - GLM模型已成为Windsurf、OpenCode等国际知名编程及智能体平台的默认模型[11] 商业结构重估与未来叙事 - 市场的关注点从参数规模、榜单排名转向模型是否进入真实生产环境、调用是否具备持续性、客户是否价值优先[13] - 提出了“Token架构能力”概念,指组织调度、吸收智能并将其转化为经济成果的能力,这被视为未来的核心竞争力[12] - 智谱旨在成为智能时代最底层的能力供给者,其增长故事从证明模型能通过API售卖,转向讲述其帮助组织提升Token架构力的能力[12] - 行业竞争正从比拼调用量规模,转向比拼谁能将智能卖出溢价[13]
智谱与MiniMax上市:AI大模型“告别草莽”
搜狐财经· 2026-01-13 21:13
行业阶段与竞争格局 - 中国大模型行业告别“参数竞赛”的草莽时代,进入“商业闭环”的验证期 [2][17] - “百模大战”狂热竞争落幕,行业呈现明显分化,路径开始收敛 [16][18] - 互联网大厂凭借资金、流量与生态优势入局,改变了竞争格局,与创业公司形成不对称竞争 [23][24][25] 智谱AI的商业模式与表现 - 公司选择MaaS(模型即服务)的“被集成”之路,旨在构建“AI时代的操作系统”,赋能千行百业 [2][3] - 截至2025年9月底,已服务1.2万家企业客户、超4500万名开发者,国内前十大互联网公司中有9家采用其GLM模型 [3] - 2025年MaaS ARR年化收入从2000万增至超5亿,10个月实现25倍增长 [3] - 收入从2022年的5740万元增长至2024年的3.124亿元,年复合增长率达130% [7] - 2025年上半年收入1.91亿元,同比增长325%,中信证券预测其2025年全年收入将达7.38亿元 [7][8] - 业务重心从本地化部署向云端MaaS服务转型,云端收入占比从2022年的极低水平升至2025年上半年的15.2% [15] MiniMax的商业模式与表现 - 公司走全球化C端路线,押注全模态大模型与AI原生产品 [3] - 2025年前三季度,其C端收入占比高达71.1%,海外市场贡献了超过73%的收入 [3] - 收入从2023年的350万美元飙升至2024年的3050万美元,同比增速达782.2% [8] - 2025年前三季度收入已达5344万美元,同比增长175% [8] 财务共性与挑战 - 两家公司均呈现高增长与高亏损并存的财务特征 [6] - 智谱2022年至2025年上半年累计亏损超62亿元,2025年上半年月均亏损达3亿元 [9] - MiniMax同期累计亏损约93亿元,2024年净亏损达32.7亿元 [9] - 亏损核心源于占研发支出70%以上的巨额算力成本 [10] - 智谱2022年至2024年算力累计投入超18亿元 [12] - MiniMax向阿里云购买云计算服务费累计高达7100万美元 [12] - 两家公司均计划将募资的70%以上继续投入模型研发与AI基础设施升级 [13] 商业模式路径对比 - 智谱代表“稳健派”,深耕MaaS模式,追求作为“基础设施”的长期价值、确定性与稳定性 [4][5][26] - MiniMax代表“进取派”,强调产品力与市场速度,赌的是成为全球化的“超级应用” [5][27][28] - 智谱的“To B再To C”路径客户粘性高、收入稳定,但本地化部署项目周期长、回款慢 [3][15] - MiniMax的C端订阅模式现金流更为健康,用户增长可期,但面临激烈竞争 [16] 资本市场意义与行业展望 - 智谱与MiniMax在港股成功上市,市值均突破千亿港元,为行业提供了宝贵的观察窗口 [2] - 上市标志着资本市场对中国大模型企业的估值认知转向注重“技术资产”与“生态潜力”的新范式 [29] - Tokens作为AI服务的底层计价单位,成为衡量企业价值的新标尺 [30] - 行业未来将是多元路径并行,没有唯一正确答案,只有不断试错与迭代 [30][31]
智谱与MiniMax上市:从“讲故事”到“交报表” | AI系列
搜狐财经· 2026-01-12 20:41
行业阶段与竞争格局 - 中国大模型行业告别“参数竞赛”的草莽时代,进入“商业闭环”的验证期 [2][17] - “百模大战”的狂热竞争逐渐落幕,行业呈现明显分化,路径开始收敛 [16][18] - 互联网大厂凭借资金、流量与生态优势入局,改变了竞争格局,与创业公司形成不对称竞争 [23][24][25] 智谱公司的商业模式与财务表现 - 公司选择MaaS(模型即服务)的“被集成”之路,旨在构建“AI时代的操作系统”,赋能千行百业 [2][3] - 截至2025年9月底,已服务1.2万家企业客户、超4500万名开发者,国内前十大互联网公司中有9家采用其GLM模型 [3] - 2025年,其MaaS ARR年化收入从2000万增至超5亿,10个月实现25倍增长 [3] - 收入从2022年的5740万元增长至2024年的3.124亿元,年复合增长率达130%;2025年上半年收入1.91亿元,同比增长325% [7] - 2022年至2025年上半年累计亏损超62亿元,2025年上半年月均亏损达3亿元 [9] - 业务重心从本地化部署向云端MaaS服务转型,云端服务收入占比从2022年的极低水平升至2025年上半年的15.2% [15] MiniMax公司的商业模式与财务表现 - 公司走全球化C端路线,押注全模态大模型与AI原生产品,以Talkie/星野、海螺AI等产品在海外市场扩张 [3] - 2025年前三季度,其C端收入占比高达71.1%,海外市场贡献了超过73%的收入 [3] - 收入从2023年的350万美元飙升至2024年的3050万美元,同比增速达782.2%;2025年前三季度收入达5344万美元,同比增长175% [8] - 2022年至2025年上半年累计亏损约93亿元,2024年净亏损达32.7亿元 [9] 行业财务共性与挑战 - 大模型产业呈现“高增长与高亏损并存”的财务图景 [6] - 巨额亏损的核心源头是占研发支出70%以上的算力成本 [10] - 智谱2022年至2024年算力累计投入超18亿元;MiniMax仅向阿里云购买云计算服务费累计就高达7100万美元 [12] - 两家公司均计划将募资的70%以上继续投入模型研发与AI基础设施升级 [13] 不同发展路径的战略选择 - 智谱代表“稳健派”,深耕MaaS模式,追求AI作为“基础设施”的长期价值、确定性与稳定性 [4][5] - MiniMax代表“进取派”,强调产品力与市场速度,赌的是成为下一个全球化的“超级应用” [5] - 两种路径是适应不同市场环境与企业禀赋的理性选择,在商业化初期并无绝对优劣 [6] 资本市场意义与估值范式转变 - 智谱与MiniMax的成功上市,标志着港股及全球资本市场对中国大模型企业的估值认知从传统PE、PB框架,转向更注重“技术资产”与“生态潜力”的新范式 [27] - Tokens作为AI服务的底层计价单位,成为衡量企业价值的新标尺 [27]
人工智能强基“筑”高地
杭州日报· 2026-01-09 10:32
公司上市与市场地位 - 北京智谱华章科技股份有限公司于1月8日在香港联合交易所挂牌上市,股票代码02513.HK,成为全球首家以通用人工智能基座模型为核心业务的上市公司 [1] - 公司成立于2019年,脱胎于清华大学计算机系技术成果,是中国大模型研发领域的先行者与重要创新者,被公认为国内大模型领域的“六小虎”之一 [1] - 此次上市标志着中国AGI企业正式迈入资本市场舞台中央,开启与国际巨头同台竞技的新阶段 [1] 公司技术与产品生态 - 公司坚持全栈自研,其GLM模型架构全面对标国际前沿 [1] - 公司成功构建了覆盖基座大模型、对话交互、代码生成、多模态理解及智能体的完整技术生态 [1] - 公司已先后推出百亿、千亿及万亿参数模型,奠定了扎实的技术声誉与开发者基础 [1] 战略投资与产业协同 - 智谱是上城资本集团产业基金战略投资的企业,也是该集团去年以来成功推动上市的首家人工智能被投企业,彰显了上城资本在人工智能领域的精准投资能力和产业孵化成效 [1] - 作为直投方,上城资本集团通过战略协作为智谱对接产业资源、加速商业化进程提供了积极支撑 [2] - 未来,上城资本集团将继续深化与智谱的战略协同,全力支持智谱在本地的深耕与发展 [3] 区域布局与业务发展 - 智谱浙江总部正积极推动大模型技术的应用深化,聚焦政务、教育、跨境电商等领域打造标杆示范项目 [2] - 智谱高级副总裁表示,吸引智谱浙江总部落户上城区的因素是当地作为都市经济标杆区的发展潜力、包容开放的产业生态与精准的科创政策 [2] - 智谱将以浙江总部为依托,持续推进技术应用落地与产业生态构建,助力上城打造人工智能产业创新发展新高地 [3] 行业与政策环境 - 智谱拿下“全球大模型第一股”,凸显出中国在人工智能基础模型领域的产业链完整度与政策支持逐步成熟,为国产大模型发展注入资本活力 [1] - 上城区委会议明确要着力在人工智能创新引领、上城特色现代化产业体系构建上奋进突破,提出要纵深推进人工智能创新高地建设,锚定打造人工智能创新发展第一城重要一极 [2] - 上城区计划加速落地具身智能先导区“一带一圈一集群”发展布局,健全“算力+数据+模型+应用”协同支撑体系,大力推进人工智能科技创新、产业发展、赋能千行百业 [2]