全模态融合 - 财报，业绩电话会，研报，新闻

全模态融合

搜索文档

从MiniMax首份财报看AI产业趋势：技术迭代推动Token和商业化上量，26年重点看全模态融合

东方证券· 2026-03-04 13:28

行业投资评级 - 传媒行业投资评级为“看好（维持）” [6] 核心观点 - 报告认为，在AI倍增的产业趋势下，增量思维远大于存量竞争，看好有技术独特性、战略定力和研发效率的创业公司机会 [3] - 区别于大厂，AI创业公司在有限资源前提下，创始人对于技术前瞻性的判断、公司研发定力和迭代速度，是其能否在AI产业变革中拿到新场景空间扩容红利的关键要素 [3] - AI行业的高增速和迭代变化，决定了现阶段更重要是保持模型的领先性和影响力，每一代新技术突破有望带来长期阶梯式的增长机会 [9] 从MiniMax财报看AI产业趋势 - MiniMax 2025年全年收入同比增长159%，达到7904万美元，毛利率环比提升13个百分点至25.4%，经调整净亏损2.5亿美元 [2] - 2025年第四季度，MiniMax收入同比增长131%至2560万美元，其中开放平台及其他基于AI的企业服务收入同比增长278%达1055万美元（占比同比提升16个百分点至41%），AI原生产品收入同比增长82%达1506万美元 [2] - 2025年第四季度毛利率为29.7%，经调整净亏损6458万美元 [2] - 得益于2026年2月M2.5版本发布，模型能力突破带动使用量高增，2月的日均token消耗增长至2025年12月的超6倍，其中来自coding plan的token消耗增长超10倍 [9] - 商业化指标ARR（年度经常性收入）在2026年2月达到1.5亿美元，按照最新月收入测算，较2025年第四季度月均收入增长46% [9] 技术迭代与商业化前景 - 技术迭代是推动Token消耗和商业化上量的关键动力，重要版本发布是ARR脉冲式增长的前瞻指标 [9] - 2026年提升模型智能上限的路径之一是**全模态融合**，关注上半年M3系列发布 [9] - MiniMax认为要持续提升智能水平，多模态融合是基本前提，其全模态路线目前处于第二阶段，旨在通过融合所有模态提升智能上限，预计通过上半年发布的M3系列模型体现 [9] - 编程、办公、多模态生成有望受益于技术跃迁，实现商业化加速扩容 [9] - 全模态融合的壁垒在于：每一个模态的研发积累漫长；模态协同需要海量数据处理（如视频数据量庞大且信息冗余）；需要进行架构重构以统一训练模式；以及数据处理、存储等基础设施的重新设计 [3] MiniMax的竞争壁垒与策略 - MiniMax创始人对于战略定位有敏锐判断和定力，例如不做容易和大厂正面冲突的移动端Chatbot产品，而是将资源押注在能产生独特价值的模型研发和agent产品创新上 [3] - 在迭代速度上，MiniMax在108天内完成从M2到M2.1到M2.5的迭代，充分利用组织敏捷性，保持研发效率 [3] 投资建议与标的 - 看好具有硬件-研究-模型-应用场景全栈AI路径的科技大厂，以及具有全模态技术布局的模型厂商机会 [4] - 相关标的包括：阿里巴巴-W(09988，买入)、谷歌-A(GOOGL.O，未评级)、MINIMAX-WP(00100，未评级)、智谱(02513，未评级)等 [4] - 重视其他具备模型能力的厂商及相关产业链，以及受益于底模能力迭代、下游应用场景体验改善的标的 [4] - 相关标的包括：腾讯控股(00700，买入)、快手-W(01024，买入)等 [4]

中金 _ AI主线开年布局展望：MiniMax首次覆盖

中金· 2026-02-25 12:08

报告投资评级与核心观点 * 首次覆盖MiniMax-WP（00100），公司是当前国内少数在基础模型能力与全球化AI原生应用商业化两端同时跑通的公司，在AI赛道中具备稀缺性 [2] 公司概况与稀缺性 * **业务布局**：公司以全模态融合技术模型为核心，向上构建AI原生应用与平台，形成了从模型到应用的全栈布局 [10][11] * **战略定位**：公司是国内最早押注原生全模态融合路线的基模厂商之一，从成立初期即同步推进文本、语音、视频模型研发 [2] * **全球化验证**：2025年前三季度，公司海外收入占比超过73%，覆盖超过200个国家及地区，是国内少有的已验证海外市场规模化变现能力的基模厂商 [2] * **商业模式**：公司坚定执行“技术即产品”路线，采用“前店后厂”模式加速模型与产品的拟合迭代 [2][16] * **组织效率**：公司为AI原生组织，秉持高效组织理念，截至2025年第三季度末，公司仅385名全职员工，其中研发人员占比73.8%，CEO以下设立不超过三层职级 [2][15][16] 行业趋势与竞争格局 * **市场规模**：全球生成式AI收入总市场规模预计将从2023年的929亿美元增长至2032年的16,198亿美元，年复合增长率约37% [25] * **竞争态势**：大模型行业从“百模大战”逐渐收敛至头部厂商，全球头部厂商表现出“竞相迭代、轮番领跑”的竞争态势 [26] * **取胜关键**：大模型研发遵循A=V*D的动力学模型，其中A代表模型能力进化加速度，V代表训练速度（含计算资源、组织能力等），D代表战略投入方向 [38] * **先发优势维持**：实现好的“工作负载-模型匹配”（WMF）有助于把握先发优势、提升用户留存率，形成“水晶鞋效应” [47] 公司多模态战略与技术优势 * **文本模型能力领先**：公司文本模型能力被市场低估，其M2模型发布后不久在Artificial Analysis智能指数榜单位列第五名 [30][31][50] * **文本模型迭代与性能**：M1模型在长上下文场景下具备极致性价比，原生支持100万Token上下文长度；M2模型采用交错思维链技术，具备反思能力；M2.5模型在编程、工具调用等场景达到或刷新行业SOTA水平，且价格仅为Opus、GPT-5等模型的5%-10% [50][54][67] * **视频模型全球领先**：公司Hailuo-02视频模型发布后在Artificial Analysis榜单排名全球第二 [30][31][81] * **音频模型全球领跑**：公司Speech 2.6模型在Artificial Analysis全球文生音频榜单中位列首位 [91][92] * **统一多模态竞争优势**：公司认为统一多模态是未来技术趋势，其在文本、图像、视频和音频等模态均拥有行业领先的自研模型，具备“全模态自研闭环”的技术积累，在统一多模态演进方向上有显著优势 [68][75] 产品矩阵与市场空间 * **AI Agent产品**：公司于2026年1月发布MiniMax Agent 2.0桌面端，定位从“对话助手”升级为“AI原生工作台”，采用模块化专家体系，支持与本地环境深度耦合 [99][105][107] * **Agent市场空间**：根据ARK研究测算，在乐观假设下，全球软件支出有望从2025年的1.43万亿美元增长至2030年的13万亿美元，年复合增长率56%，AI生产力具备十万亿美元级市场想象空间 [113] * **音视频产品**：公司音视频产品包括海螺AI（视频生成）与MiniMax语音（语音合成），其中海螺AI在全球头部视频生成产品中具备“物理一致性强”与“可控性高”的突出优势 [118][127] * **音视频市场竞争**：在语音生成领域，与ElevenLabs相比，MiniMax语音在长文本处理能力（单次最高20万字符）、延迟稳定性（端到端延迟低于250毫秒）和定价上具有优势 [130][136] * **音视频市场空间**：音视频生成市场面向专业创作者（P端）、企业客户（B端）和大众用户（C端），报告测算中性假设下，P端市场空间为32亿美元，B端为94亿美元，C端（社交平台）为917亿美元 [143][147][149] * **AI陪伴产品**：公司拥有Talkie/星野等全球头部AI陪伴与互动产品，据ARK Invest测算，AI陪伴软件市场规模在2030年可能达到700-1,500亿美元 [152][155]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

中金：首予MINIMAX-WP(00100)“跑赢行业”评级目标价1109港元

智通财经网· 2026-02-20 11:09

研报核心观点 - 首次覆盖MINIMAX-WP(00100)给予跑赢行业评级，目标价1,109.00港元，基于P/S估值法对应2027年估值倍数75x [1] - 公司是国内少数在基础模型能力与全球化AI原生应用商业化两端同时跑通的公司，在AI赛道中具备稀缺性 [1] - 目标价较当前股价有31%上行空间，公司当前交易于2027年57x P/S [8] 公司技术路线与能力 - 公司是国内最早押注原生全模态融合路线的基模厂商之一，从成立初期即同步推进文本、语音、视频模型研发 [2] - 随着Agent、世界模型推进，全模态理解与生成正逐步成为重要的基础能力，公司已形成统一技术栈并积累了先发经验 [2] - 公司在研发理解生成一体化多模态模型上具有优势 [6] 商业模式与市场表现 - 公司坚定执行“技术即产品”路线，采用“前店后厂”模式加速模型与产品的拟合迭代 [4] - 研发团队与产品团队高度协同，使新模型能力能够快速完成产品化并推向市场，降低技术转化过程中的摩擦损耗 [4] - 公司是国内少有的验证海外市场规模化变现能力的基模厂商，2025年前三季度海外收入占比超过73%，覆盖200多个国家及地区 [3] - 通过AI原生产品、开发者平台直接触达高付费意愿用户，在欧美等成熟市场快速拓展，实现自我造血并获取真实市场反馈 [3] 组织架构与运营效率 - 公司是AI原生组织，将AI能力深度嵌入内部工作流 [5] - 秉持高效组织理念，具有高人才密度和高人效，截至2025年第三季度公司仅385人，其中研发人员占比73.8% [5] - 组织架构扁平，CEO以下设立不超过三层职级，支持模型与产品的高效迭代 [5] 财务预测与估值 - 预计公司2025年至2027年收入分别为0.71亿美元、2.28亿美元、5.98亿美元 [8] - 2024年至2027年收入的复合年增长率(CAGR)预计为170% [8] - 基于2027年75x P/S的估值倍数给予目标价 [1][8] 市场观点差异与催化剂 - 与市场观点不同之处在于，认为公司在技术即产品、全球化、高效率方面具有稀缺性 [6] - 潜在催化剂包括公司新版本模型发布以及行业技术演进 [7]

MINIMAX-W(HK:00100)

Artificial Intelligence

全模态融合

Artificial Intelligence

全模态融合

Artificial Intelligence

MiniMax稀宇科技薛子钊：AI大模型不是"砸钱游戏"，国内大模型被严重低估｜Alpha峰会

华尔街见闻· 2025-12-22 15:55

文章核心观点 - AI大模型行业与移动互联网有本质区别其市场空间完全由模型智能水平驱动且增长呈跳跃式而非连续性每次智能跃升都会解锁全新应用场景和市场 [5][11][13] - 行业增长迅猛全球头部模型层公司年化总收入已接近300亿美元且月度环比保持双位数增长但能持续发布全球领先模型的玩家数量却在减少目前全球仅约10家国内从“百模大战”演变为个位数公司竞争 [19][20][23] - 成功的核心壁垒并非单纯依赖资源堆砌而在于能否构建高效的研发组织并持续创新以跟上行业每3-6个月一次的快速迭代资源雄厚的大厂若无法持续创新也会被淘汰 [6][20][22][23] - MiniMax是全球仅有的四家在语言、视频、声音三个模态均达到全球领先水平的公司之一另外三家是OpenAI、谷歌和字节跳动公司认为未来竞争将是全模态融合 [3][39] - MiniMax将超过80%的资源投入模型层和基础设施视模型本身为核心产品应用只是展示窗口其战略是提供更高的“每块钱智能水平” 用更少资源做出更领先的模型 [3][30][38][40] 行业特点与趋势 - **市场驱动因素独特**：行业市场空间唯一的核心驱动因素是模型的智能水平其提升是非连续性的跳跃例如GPT-3.5到GPT-4的跃升每次跃升都会解锁此前不可行的新场景 [11][13] - **增长飞轮效应**：模型智能提升解锁新场景带来商业化收入收入再投入研发推动智能进一步攀升形成独特闭环 [14] - **颠覆性影响**：随着模型智能水平从L2提升至接近智能体的L3级别许多传统软件工作流程可能被模型自主完成导致部分SaaS公司从AI受益者变为潜在被替代对象其市场被划入大模型范畴 [16] - **多模态渗透加速**：在视频生成领域模型已用于辅助短剧制作和广告行业在图像领域专业修图场景正被AI取代这些市场的渗透都随模型智能提升而进行 [17] - **玩家集中化**：尽管市场高速增长但能留在模型层持续竞争的玩家数量在减少全球仅约10家国内从“百模大战”的百家公司减少到个位数 [20][23] MiniMax公司战略与成果 - **全模态布局**：公司自创立第一天起就同时研发语言、视觉和声音三个模态的大模型旨在构建能通过图灵测试的全模态智能体 [25][26] - **研发高效性**：作为独立创业公司其资源消耗与美国头部公司相差两个数量级但通过更高的研发和资金使用效率实现了快速迭代和突破 [38] - **全球化运营**：公司从第一天就是全球化公司所有产品均服务全球用户目前大部分商业化收入来自海外 [3][38] 各模态技术突破与市场地位 - **语言模型**：2024年10月发布的M2语言模型是全球开源模型中真实token用量最大的AI编程模型成为首个真正切入该领域的国产模型其用量相当于其他所有国产模型的总和在该场景用量份额排全球第三 [3][32][34] - **视频模型**：海螺视频生成模型是全球用量最大的模型之一与谷歌Veo、OpenAI Sora同属第一梯队每天生成接近200万条视频超过谷歌Veo上个季度公布的每日100多万条 [32][33] - **语音模型**：公司的语音模型已实现从文字生成语音的突破技术表现曾达到全球第一驱动了大量智能硬件、虚拟主播及有声书内容在国内市场与字节跳动合计占据几乎全部份额 [31] 产品与应用 - **核心产品为模型**：公司认为底层模型是核心产品而面向C端、B端和开发者的应用只是模型打包集成的渠道或展示窗口 [30] - **智能体应用**：公司推出的Agent智能体产品在调研、写报告等任务上已超越普通实习生水平内部HR、财务、商务分析等部门已高度依赖未来可能自主完成简历筛选、联系候选人甚至面试 [3][39] - **代表性产品**：包括海螺视频生成平台、陪伴类产品Talkie/星野以及面向企业和开发者的开放平台 [30][38] 行业竞争与估值观察 - **技术差距缩小**：国内大模型公司在技术上已接近甚至在某些领域超越美国同行且差距持续缩小 [3] - **估值严重低估**：国内公司与美国同行在估值上相差两个数量级例如美国头部公司估值可能是中国公司的100倍但技术领先可能只有5% 而投入却在50至100倍之间相比之下国内公司研发效率更高但被严重低估 [3][38]

AI大模型

通用人工智能

全模态融合

Artificial Intelligence

Artificial Intelligence

Agent智能体

M2语言模型

AI产业速递：从DeepSeek V3

2025-12-03 10:12

**行业与公司** * 行业涉及人工智能与大模型领域重点包括强化学习合成数据稀疏化技术注意力机制优化等方向[1] * 核心公司包括 Deepseek DeepMind OpenAI 以及提及的谷歌阿里等大型科技公司[1][7][9] **Deepseek V3 2 模型的核心技术特点与改进** * 架构上引入 DSA 机制取代 MLA 机制通过位置编码计算索引选取关键注意力参数优化推理效率尤其在复杂任务中减少冗长思维链的计算负担[1][3] * 后训练阶段的 C9 版本投入约10%的预训练计算量显著提升模型在复杂任务（如代码调试）中的强化学习能力达到全球领先水平[1][3][5] * 采用高效的上下文管理策略智能处理用户频繁开启新任务多轮对话及模糊输入有效降低推理成本[1][3] * 使用大量人类专家编写并增量训练生成的高难度合成数据比例较之前增加一倍以上对后续强化学习阶段至关重要[1][3][4][6] * DSA 机制结合筛选和缓存技术将 KV 缓存量降至50%以下筛选机制可减少90%的 KV 缓存占比[18] * 在稠密阶段冻结部分参数仅用少量参数（例如7 000亿参数模型中用20亿参数）进行初步规律提取再进行稀疏训练提高效率[18] **强化学习技术的最新发展与影响** * DeepMind 的新框架结合 Rubik‘s 规则提示机制使系统能边思考边执行并根据环境反馈调整策略提高了强化学习效率[8][9] * 该框架促使大型科技公司加速探索多模态视频和图像领域的应用推动2025年相关模型发展[1][9] * 强化学习所需算力受数据条目数量数据采样系数（简单任务为2-4倍高难度任务可达128倍）思维链输入输出长度等因素影响浮动范围可达50倍[13][14] * 预计到2026或2027年强化学习所需算力将接近预训练算力的一半国内模型该比重可能达到20%至30%[15] **合成数据的作用与优势** * 合成数据比例大幅增加其效果与难度系数密切相关高难度高质量的合成数据极大提升了模型在强化学习阶段的性能[6] * 在缺乏真实数据的极罕见长尾场景（如汽车高速碰撞）中合成数据尤为重要可通过智能体思维生成新个体和模拟环境来提升模型性能[16] **开源与闭源模型的趋势变化** * Deepseek 完成了全面的后训练过程并将结果开源支持 Agent 调用能力使得开源模型在功能上可与闭源模型媲美可能引领开源项目新趋势[7] **稀疏化技术与未来模型价格趋势** * 稀疏化技术降低了训练算力要求并提升了训练上限激发开发更大参数模型的动力[2][19] * 预计到2026年模型价格将大幅下降可能降至现在的1/5 这将激发更多创业公司参与大模型开发[2][20] **预训练算力消耗现状与发展** * 全球主要厂商预训练算力需求显著提升美国一些领先企业算力达10^25到10^26 FLOPS 相比 DeepMind（10^24 FLOPS）增长50到100倍[7] * 预训练算力需求增速趋缓但通过基础设施效率提升（如TPU集群优化）大规模预训练依然有发展潜力[17] **下一代大模型发展方向** * 发展方向集中在全模态融合（文本图片视频音频）与物理世界数据交互以及具备更自适应推理机制更强人机交互和长时间记忆能力[22] * V4 模型将基于现有高版本推进重点验证和增强 Agent 功能[25] **大模型能力上限的迁移** * 后训练的潜力越来越大模型能力上限正从预训练向后训练迁移尤其在人文创意等没有固定答案的领域其能力逐渐被打开将吸引更多应用厂商[10][11] **垂直场景中的应用示例** * 以电商平台AI万能搜索为例通过多轮对话机制基于用户历史数据 prompt响应和反馈数据不断优化推荐结果满足个性化需求[12]

Artificial Intelligence

Artificial Intelligence

DeepSeek V3.2