多模态融合 - 财报，业绩电话会，研报，新闻

多模态融合

搜索文档

2026-03-03 10:52

电话会议纪要分析：MiniMax 一、涉及的行业与公司 * 涉及的行业为**人工智能（AI）行业**，具体涵盖大语言模型、多模态AI、AI编程智能体、AI办公应用、AI视频生成等领域[2][7][9] * 涉及的**公司是MiniMax**，一家专注于AI模型研发与产品化的初创公司[1][2][4] 二、核心观点与论据 1. 公司战略定位与核心竞争力 * 公司的战略目标是发展成为**AI时代的平台型公司**，核心驱动力在于持续提升模型的**智能密度**和**token吞吐能力**[2][10] * 核心竞争力基于三方面协同能力：**模型**的长期积累与快速迭代、**“模型+产品”一体化**能力、以及推动**生态**发展的能力[2][4][5] * 坚持**差异化战略**，有所为有所不为，例如2023年即明确不做移动端通用个人助手（类似豆包、ChatGPT），将资源集中于能创造独特价值的Agent与海螺视频等方向[10] 2. 技术路径：坚持多模态融合 * 公司认为**多模态融合**是持续提升AI智能的基本前提，并已系统布局多年[4][6] * 多模态推进分为两个阶段：第一阶段（过去4年）已在**语言、视觉、声音、音乐**等单模态上打造出行业内有影响力的模型；第二阶段（当前）致力于各模态能力的整合以形成新突破，预计2026年上半年推出的**M3与海螺3**将体现该阶段成果[6][7] * 公司是国内仅有的三家在各模态均能达到较领先水平的公司之一，且是其中唯一的初创公司[7] * 视频生成被认为是AGI领域中除编程与智能助手之外**最大的市场**，2026年有望推进到中长视频及接近实时生成，公司有望在该市场获得独特机会[2][7] 3. 市场机会与产品进展 * **编程智能（AI Agent）**：L4/L5级别将实现“同事级、组织级”的智能，2026年有望从“辅助工具”显著跃迁至“同事级协作”[2][8][11] * **办公智能**：潜在市场可能大于编程，覆盖人群更广（如数据分析、文档撰写、PPT制作等），预计2026年办公领域的推进速度可能达到2025年编程场景的增长速度[9][11] * **模型迭代与增长**：从M2到M2.5三代模型仅用**108天**，保持了行业内极快的迭代节奏[4][9] * **2026年前两个月业绩**：M2系列模型的**token使用量已达到2025年12月水平的6倍**，增速超预期，可能与Open Cloud生态发展及模型在coding能力与可用性方面的升级有关[3][11] 4. 研发理念与组织效能 * 强调**研发效率**而非单纯资源投入，胜负取决于模型智力进步速度是否能带来更大规模商业化收入[2][10] * 通过“**A准的实习生**”实践（AI Agent覆盖90%员工），将公司作为实验场，带来了两大增量认知：一是显著提升进步速度并压缩组织链路，加快从模型迭代到用户服务的闭环；二是反向澄清模型智能的目标定义，加速研发定向[4][12] * 在AI native的组织架构下，全模态研发费用相较其他创业公司并不高，且显著低于巨头投入，但各模态均已形成有竞争力的模型[7] 5. 行业趋势与竞争格局判断 * 认为AI行业仍处于高速增长阶段，更接近“**每年增量远大于存量**”的扩张型市场，并非典型的“winner-take-all”格局，具备持续创新与差异化能力的公司能获得结构性机会[4] * 行业增长将呈现**阶梯式上行**，而非线性外推[3][11] * 公司正积极准备迎接2026年智能涌现可能带来的多个“**超级PMF**”（产品市场契合），预计未来一年的渗透率与加速度将快于市场普遍预期[3][11] * 竞争的核心目标是建设成为AI时代的平台公司，长期来看全球范围内只会留下少数AI平台型公司，公司目标是成为其中潜在的独立公司之一[10] 三、其他重要内容 * 公司在**OpenCloud生态**中已有大量早期开发者，因模型性价比较高，尤其适配大投放量场景，降低了开发者门槛[5] * 公司产品进一步集成OpenCloud，通过Agent的**MAAS Claw**降低终端用户门槛，并向**OpenClaw**贡献代码，体现了参与和促进生态建设的能力[5] * 公司判断，在巨头、创业公司与开源模型并存的格局下，**持续赢得关键战役的关键**在于两点：一是技术能力持续突破边界；二是利用边界突破推动产品与业务逐步具备生态属性[12]