M系列模型 - 财报，业绩电话会，研报，新闻

M系列模型

搜索文档

2026-02-25 12:12

电话会议纪要关键要点一、涉及的行业与公司 * 行业：**通用人工智能 (AGI) / 大模型** 行业，具体涉及**模型能力、AI Agent、AI Coding、多模态生成**等细分领域 [2][16][29][34] * 公司：**智普 (Zhipu)** 和 **MiniMax**，被描述为全球前两家也是仅有的两家上市大模型公司 [2] 二、关于智普 (Zhipu) 的核心观点与论据 1. 公司定位与核心价值 * 公司是**非常纯粹的基模公司**，其核心价值与后盾是**研发能力** [3][4] * 公司背景为**清华系、国家队**，拥有豪华且稳定的股东结构，包括创始人、互联网巨头（美团、蚂蚁、阿里）及中央/地方国资 [3][8][9] 2. 模型能力与战略路线 * 公司确立了以 **“中国最领先的coding模型”和“coding-agentic-tree”** 为主要方向的战略路线 [4] * 模型能力处于**国内领先、全球前列**：GLM5在综合跑分（Artificial Analysis Index）中位列**全球第四、国内第一**，在单体表现上可对标Anthropic Claude 4.5 [11][22] * GLM5实现了参数规模的大幅提升，从GLM4.7的**3500多亿**参数量提升至**7400多亿**，接近翻倍 [25] * 公司持续在模型架构、强化学习框架（STEM）、注意力机制优化（降低计算复杂度）等方面进行打磨，以提升效率和降低成本 [25][26] * 公司创始人看好并致力于在**知识学习、自主学习**方向取得突破，以解决更复杂的现实问题 [12] 3. 商业化路径与增长驱动 * **商业化处于早期阶段**，收入高速增长（三倍增长）但亏损持续，因需持续投入算力与研发以保持领先地位 [10] * **增长引擎正从本地化部署转向云端和API**：2024年本地化部署收入占比**80%以上**，预计到2026年云端部署将占**50%以上**，长期看API有望占比**50%以上**，成为最核心收入来源 [14] * **Token消耗量高速增长**是API收入的先行指标：2024年Token消耗量约**0.2T**，2025年上半年达**4.6T**，预计2025年底在**6T以上** [15] * **目标市场**：本地企业客户是基本盘，**全球开发者及科技企业**是增量核心市场 [13] * **对标Anthropic**，认为其以Coding为抓手的商业化路径（收入从十几亿翻至四十五亿，再预期翻至一百八十亿）具有参考意义，智普的收入结构更接近Anthropic [5][18] 4. 竞争策略与市场机遇 * 凭借**领先的模型能力结合高性价比**（GLM5 Coding Plan价格不到Anthropic的50%）来抓住海内外中长尾市场需求 [23] * 模型能力提升后敢于**提价**，GLM5发布后平均涨价幅度在**30%以上** [23] * 专注于Coding领域，并以此为抓手向**企业级市场渗透**，与国产芯片（摩尔线程、含光等）深度适配，实现“国产芯+国产模型”双向赋能 [4][24][26] * **AI Coding是核心市场机遇**：2025年AI生成代码已占全球代码产量的**40%**，中美AI Coding市场测算规模在**2000多亿美金（万亿人民币）** [19][20] * 在竞争格局中，**独立模型厂商凭借技术趋势仍有立身之地**，行业已收敛至少数头部厂商 [17][19] 5. 产品与生态布局 * 发布**GLM Office**能力，对标Claude Desktop，渗透办公场景，实现表格自动化等操作 [26] * 在AI应用层面有**AutoGLM**（AI Agent产品）等作为商业储备，但尚处商业化早期 [27] * 公司**70%多**的员工为研发人员，构筑了人才与研发壁垒 [28] 三、关于MiniMax的核心观点与论据 1. 公司定位与核心优势 * 公司是**AI native（人工智能原生）** 公司，组织、流程、产品均围绕大模型设计，旨在实现**AGI**愿景 [29][32] * 核心竞争力概括为四点： 1. **早期押注全模态融合**，在文本、语音、视频、音乐等多模态同步研发，积累先发经验 [31] 2. **全球化与可规模化**的市场策略 [29] 3. **“前店后厂”技术即产品路线**，研发与产品高度协同，加速迭代并降低技术转化摩擦 [32] 4. **高效扁平化的AI原生组织**，据称效率可能比90% AI赋能组织高十倍，实现高人效 [32][36] 2. 模型能力与多模态布局 * 模型能力处于**全球前列**，在文本、视频、语音等多个模态均达到世界领先水平 [30][34] * **文本模型（M系列）**：支持极长上下文（100万tokens），通过“交错思维链”等方式提升Agent任务处理与泛化能力，M2曾登顶全球榜单前五，M2.5在编程、工具调用等场景迅速达到使用量第一 [39][40][41] * **视频模型（海螺系列）**：通过自研NCR架构，确立全球视频生成第一梯队地位，注重复杂指令遵循与物理表现 [30][44] * **音频/语音模型**：凭借拟人化情感表达和多语言支持建立竞争壁垒，处于全球领先位置 [30][45] * **音乐与图片模型**：支撑音频生态与AI原生创意设计场景 [30] 3. 商业化与产品矩阵 * 商业化通过**开放平台（Open Platform）** 提供多模态API服务，以及直接面向用户的**产品矩阵**进行 [56] * **产品矩阵主要包括三大类**： 1. **生产力工具（AI Agent）**：桌面端形态，锚定高效生产场景，在长文本理解、复杂指令遵循等方面表现亮眼，处于全球第一梯队 [46][47] 2. **音视频生成产品**：包括“海螺”（视频）和“再次”（音频），用于降低创作门槛和赋能多模态内容消费 [50] 3. **情感陪伴产品**：包括面向海外的“Talking”和国内的“心忆”，以拟人化对话和沉浸式体验获得高用户黏性 [30][54] * **开放平台增长亮眼**，高毛利水平得益于：技术能力带来的训练推理效率、AI用法建设、以及**视频和音频API结构性拉升毛利**（文本API市场竞争更激烈） [56][57] 4. 行业趋势与竞争策略 * 行业处于**模型能力非线性跃升、市场规模快速增长**的阶段：全球生成式AI收入规模预计从2023年**929亿美元**增至2030年**16000亿美元**，CAGR达**37%** [34] * 竞争已收敛至**头部厂商轮番领跑**的状态 [34] * MiniMax的取胜关键在于：**保持模型智能水平的全球领先** 和 **维持先发优势** [35] * 维持先发优势依赖于 **“workload-model fit”（工作负载与模型匹配）**，即领先模型能更好地嵌入用户工作流，形成迁移成本与习惯粘性 [37][38] * 未来模型发展方向：**统一多模态、Agentic（智能体化）、持续学习** [42] 5. 市场空间与估值 * **AI Agent** 有达到**十万亿美元**市场空间的想象空间 [49] * 音视频产品市场：专业创作（B端）中性假设约**30亿美元**，企业级内容生成（B端）中性假设约**94亿美元**，社交与消费级（C端）想象空间最大，中性假设约**917亿美元** [53] * 公司估值参考OpenAI和Anthropic，给予**2026年75倍PS估值** [59] 四、其他重要内容 1. 共同面临的行业背景与风险 * **Agent AI需求涌现**，带动API调用量和Token消耗量大幅增长，是当前推动模型公司预期攀升的核心因素 [2][6] * 市场普遍认为大模型趋势可能侵蚀传统SaaS、应用及互联网业务 [2] * 投资大模型公司本质是购买一张 **“通往未来的门票”**（AGI或有利生态位），因此估值需考虑其早期阶段和未来潜力，而非静态对比 [7] * 提及的风险包括：**研发、商业化、知识产权**相关风险 [28] 2. 中国市场的特点 * 中国AI产业在大模型拉动下增速非常快 [16] * 在中国，**B端（企业端）商业化变现能力目前优于C端**，因为企业付费意愿更强，这契合了智普等公司以B端为主的商业模式 [17] * 中国竞争格局与海外类似，能留在牌桌上的模型厂商越来越少 [17]

智谱(HK:02513)

Artificial Intelligence

AGI

Artificial Intelligence

GLM5

M系列模型

AutoGLM

Artificial Intelligence

AGI

Artificial Intelligence

GLM5

M系列模型

AutoGLM

从开源最强到挑战全球最强：DeepSeek新模型给出了解法

观察者网· 2025-12-02 19:38

模型发布核心信息 - 12月1日，公司发布两个正式版模型：面向日常使用的DeepSeek-V3.2和面向极致探索的DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2是9月底实验版V3.2-Exp的正式版，平衡推理能力与输出长度，适合问答场景并强化了Agent能力，官方网页端、App和API均已更新 [1][4] - Speciale版本是V3.2的长思考增强版，结合了DeepSeek-Math-V2的定理证明能力，目标是将开源模型推理能力推向极致，目前仅以临时API服务形式开放 [1] 模型性能表现 - 在公开推理测试中，V3.2已达到GPT-5水平，仅略低于Google Gemini 3 Pro，相比Kimi-K2-Thinking输出长度大幅降低，减少计算开销与用户等待时间 [6] - Speciale在多个推理基准测试中超越Gemini 3 Pro，包括美国数学邀请赛（96.0分）、哈佛MIT数学竞赛（99.2分）和IMO（84.5分） [7] - 在编程与理工科博士生测试中，Speciale仍略逊于Google顶级模型，如LiveCodeBench（88.7分）和GPQA Diamond（85.7分）低于Gemini 3 Pro的90.7分和91.9分 [7] 技术架构创新 - 公司设计了DSA（DeepSeek稀疏注意力）机制应对长文本计算量爆炸，该机制像图书管理员通过“闪电索引器”只检索关键信息，大幅降低计算复杂度 [8] - V3.2的核心亮点是“Thinking in Tool-Use”（思考型工具调用），这是AI Agent领域的“Interleaved Thinking”（交错思维链）技术的重要背书 [8][9] - 该技术将冗长、重度依赖工具的任务转化为稳定的“计划→行动→反思”循环，通过复用假设与部分结论减少多轮任务中的“状态漂移”与重复性错误 [9] 战略方向与行业定位 - 公司将“Agent能力”提升到与“推理能力”同等重要的战略位置，试图通过Agent能力将模型从“聊天机器人”进化为真正的“数字劳动力” [13] - 从经济维度看，企业真正愿意付费的是“降本增效的行动”而非“更优美的回答”，Agent使LLM从“对话式AI”进化为“动作式AI”以产生商业闭环 [13] - 公司思路已从工具转变为基础设施提供商，大模型正演变成调度工具的通用操作系统，模型是内核，Agent是用户态程序，插件则是工具 [14] 行业竞争格局 - 过去一年开源大模型生态集体爆发，阿里云Qwen系列、月之暗面Kimi、智谱GLM和MiniMax M系列均取得超越当时顶级闭源模型的成果 [1] - Google Gemini 3.0 Pro的发布重新定义了“全球最强”，其强劲性能让开源和闭源的差距瞬间又变成了一道新的天花板 [2] - 开源模型存在三个关键缺陷：对标准注意力机制的过度依赖、后训练阶段计算投入不足、Agent领域泛化能力和指令遵循能力存在明显差距 [15] 未来发展路径 - 公司计划通过增加预训练计算量填补知识空白，并优化模型推理链的“智能密度”提高效率，让模型学会“少说话、多办事” [16] - 研究员Zhibin Gou表示，训练后的瓶颈需通过优化方法和数据解决，而非仅等待更好的基础模型，持续扩大模型规模、数据量、上下文和强化学习 [17] - 公司用实打实的模型证明Scaling没死只是换了战场，当行业讨论Scaling Law是否撞墙时，公司想证明持续扩展的可能性 [19]

Artificial Intelligence

Artificial Intelligence