全模态融合
搜索文档
从MiniMax首份财报看AI产业趋势:技术迭代推动Token和商业化上量,26年重点看全模态融合
东方证券· 2026-03-04 13:28
行业投资评级 - 传媒行业投资评级为“看好(维持)” [6] 核心观点 - 报告认为,在AI倍增的产业趋势下,增量思维远大于存量竞争,看好有技术独特性、战略定力和研发效率的创业公司机会 [3] - 区别于大厂,AI创业公司在有限资源前提下,创始人对于技术前瞻性的判断、公司研发定力和迭代速度,是其能否在AI产业变革中拿到新场景空间扩容红利的关键要素 [3] - AI行业的高增速和迭代变化,决定了现阶段更重要是保持模型的领先性和影响力,每一代新技术突破有望带来长期阶梯式的增长机会 [9] 从MiniMax财报看AI产业趋势 - MiniMax 2025年全年收入同比增长159%,达到7904万美元,毛利率环比提升13个百分点至25.4%,经调整净亏损2.5亿美元 [2] - 2025年第四季度,MiniMax收入同比增长131%至2560万美元,其中开放平台及其他基于AI的企业服务收入同比增长278%达1055万美元(占比同比提升16个百分点至41%),AI原生产品收入同比增长82%达1506万美元 [2] - 2025年第四季度毛利率为29.7%,经调整净亏损6458万美元 [2] - 得益于2026年2月M2.5版本发布,模型能力突破带动使用量高增,2月的日均token消耗增长至2025年12月的超6倍,其中来自coding plan的token消耗增长超10倍 [9] - 商业化指标ARR(年度经常性收入)在2026年2月达到1.5亿美元,按照最新月收入测算,较2025年第四季度月均收入增长46% [9] 技术迭代与商业化前景 - 技术迭代是推动Token消耗和商业化上量的关键动力,重要版本发布是ARR脉冲式增长的前瞻指标 [9] - 2026年提升模型智能上限的路径之一是**全模态融合**,关注上半年M3系列发布 [9] - MiniMax认为要持续提升智能水平,多模态融合是基本前提,其全模态路线目前处于第二阶段,旨在通过融合所有模态提升智能上限,预计通过上半年发布的M3系列模型体现 [9] - 编程、办公、多模态生成有望受益于技术跃迁,实现商业化加速扩容 [9] - 全模态融合的壁垒在于:每一个模态的研发积累漫长;模态协同需要海量数据处理(如视频数据量庞大且信息冗余);需要进行架构重构以统一训练模式;以及数据处理、存储等基础设施的重新设计 [3] MiniMax的竞争壁垒与策略 - MiniMax创始人对于战略定位有敏锐判断和定力,例如不做容易和大厂正面冲突的移动端Chatbot产品,而是将资源押注在能产生独特价值的模型研发和agent产品创新上 [3] - 在迭代速度上,MiniMax在108天内完成从M2到M2.1到M2.5的迭代,充分利用组织敏捷性,保持研发效率 [3] 投资建议与标的 - 看好具有硬件-研究-模型-应用场景全栈AI路径的科技大厂,以及具有全模态技术布局的模型厂商机会 [4] - 相关标的包括:阿里巴巴-W(09988,买入)、谷歌-A(GOOGL.O,未评级)、MINIMAX-WP(00100,未评级)、智谱(02513,未评级)等 [4] - 重视其他具备模型能力的厂商及相关产业链,以及受益于底模能力迭代、下游应用场景体验改善的标的 [4] - 相关标的包括:腾讯控股(00700,买入)、快手-W(01024,买入)等 [4]
中金 _ AI主线开年布局展望:MiniMax首次覆盖
中金· 2026-02-25 12:08
报告投资评级与核心观点 * 首次覆盖MiniMax-WP(00100),公司是当前国内少数在基础模型能力与全球化AI原生应用商业化两端同时跑通的公司,在AI赛道中具备稀缺性 [2] 公司概况与稀缺性 * **业务布局**:公司以全模态融合技术模型为核心,向上构建AI原生应用与平台,形成了从模型到应用的全栈布局 [10][11] * **战略定位**:公司是国内最早押注原生全模态融合路线的基模厂商之一,从成立初期即同步推进文本、语音、视频模型研发 [2] * **全球化验证**:2025年前三季度,公司海外收入占比超过73%,覆盖超过200个国家及地区,是国内少有的已验证海外市场规模化变现能力的基模厂商 [2] * **商业模式**:公司坚定执行“技术即产品”路线,采用“前店后厂”模式加速模型与产品的拟合迭代 [2][16] * **组织效率**:公司为AI原生组织,秉持高效组织理念,截至2025年第三季度末,公司仅385名全职员工,其中研发人员占比73.8%,CEO以下设立不超过三层职级 [2][15][16] 行业趋势与竞争格局 * **市场规模**:全球生成式AI收入总市场规模预计将从2023年的929亿美元增长至2032年的16,198亿美元,年复合增长率约37% [25] * **竞争态势**:大模型行业从“百模大战”逐渐收敛至头部厂商,全球头部厂商表现出“竞相迭代、轮番领跑”的竞争态势 [26] * **取胜关键**:大模型研发遵循A=V*D的动力学模型,其中A代表模型能力进化加速度,V代表训练速度(含计算资源、组织能力等),D代表战略投入方向 [38] * **先发优势维持**:实现好的“工作负载-模型匹配”(WMF)有助于把握先发优势、提升用户留存率,形成“水晶鞋效应” [47] 公司多模态战略与技术优势 * **文本模型能力领先**:公司文本模型能力被市场低估,其M2模型发布后不久在Artificial Analysis智能指数榜单位列第五名 [30][31][50] * **文本模型迭代与性能**:M1模型在长上下文场景下具备极致性价比,原生支持100万Token上下文长度;M2模型采用交错思维链技术,具备反思能力;M2.5模型在编程、工具调用等场景达到或刷新行业SOTA水平,且价格仅为Opus、GPT-5等模型的5%-10% [50][54][67] * **视频模型全球领先**:公司Hailuo-02视频模型发布后在Artificial Analysis榜单排名全球第二 [30][31][81] * **音频模型全球领跑**:公司Speech 2.6模型在Artificial Analysis全球文生音频榜单中位列首位 [91][92] * **统一多模态竞争优势**:公司认为统一多模态是未来技术趋势,其在文本、图像、视频和音频等模态均拥有行业领先的自研模型,具备“全模态自研闭环”的技术积累,在统一多模态演进方向上有显著优势 [68][75] 产品矩阵与市场空间 * **AI Agent产品**:公司于2026年1月发布MiniMax Agent 2.0桌面端,定位从“对话助手”升级为“AI原生工作台”,采用模块化专家体系,支持与本地环境深度耦合 [99][105][107] * **Agent市场空间**:根据ARK研究测算,在乐观假设下,全球软件支出有望从2025年的1.43万亿美元增长至2030年的13万亿美元,年复合增长率56%,AI生产力具备十万亿美元级市场想象空间 [113] * **音视频产品**:公司音视频产品包括海螺AI(视频生成)与MiniMax语音(语音合成),其中海螺AI在全球头部视频生成产品中具备“物理一致性强”与“可控性高”的突出优势 [118][127] * **音视频市场竞争**:在语音生成领域,与ElevenLabs相比,MiniMax语音在长文本处理能力(单次最高20万字符)、延迟稳定性(端到端延迟低于250毫秒)和定价上具有优势 [130][136] * **音视频市场空间**:音视频生成市场面向专业创作者(P端)、企业客户(B端)和大众用户(C端),报告测算中性假设下,P端市场空间为32亿美元,B端为94亿美元,C端(社交平台)为917亿美元 [143][147][149] * **AI陪伴产品**:公司拥有Talkie/星野等全球头部AI陪伴与互动产品,据ARK Invest测算,AI陪伴软件市场规模在2030年可能达到700-1,500亿美元 [152][155]
中金:首予MINIMAX-WP(00100)“跑赢行业”评级 目标价1109港元
智通财经网· 2026-02-20 11:09
研报核心观点 - 首次覆盖MINIMAX-WP(00100)给予跑赢行业评级,目标价1,109.00港元,基于P/S估值法对应2027年估值倍数75x [1] - 公司是国内少数在基础模型能力与全球化AI原生应用商业化两端同时跑通的公司,在AI赛道中具备稀缺性 [1] - 目标价较当前股价有31%上行空间,公司当前交易于2027年57x P/S [8] 公司技术路线与能力 - 公司是国内最早押注原生全模态融合路线的基模厂商之一,从成立初期即同步推进文本、语音、视频模型研发 [2] - 随着Agent、世界模型推进,全模态理解与生成正逐步成为重要的基础能力,公司已形成统一技术栈并积累了先发经验 [2] - 公司在研发理解生成一体化多模态模型上具有优势 [6] 商业模式与市场表现 - 公司坚定执行“技术即产品”路线,采用“前店后厂”模式加速模型与产品的拟合迭代 [4] - 研发团队与产品团队高度协同,使新模型能力能够快速完成产品化并推向市场,降低技术转化过程中的摩擦损耗 [4] - 公司是国内少有的验证海外市场规模化变现能力的基模厂商,2025年前三季度海外收入占比超过73%,覆盖200多个国家及地区 [3] - 通过AI原生产品、开发者平台直接触达高付费意愿用户,在欧美等成熟市场快速拓展,实现自我造血并获取真实市场反馈 [3] 组织架构与运营效率 - 公司是AI原生组织,将AI能力深度嵌入内部工作流 [5] - 秉持高效组织理念,具有高人才密度和高人效,截至2025年第三季度公司仅385人,其中研发人员占比73.8% [5] - 组织架构扁平,CEO以下设立不超过三层职级,支持模型与产品的高效迭代 [5] 财务预测与估值 - 预计公司2025年至2027年收入分别为0.71亿美元、2.28亿美元、5.98亿美元 [8] - 2024年至2027年收入的复合年增长率(CAGR)预计为170% [8] - 基于2027年75x P/S的估值倍数给予目标价 [1][8] 市场观点差异与催化剂 - 与市场观点不同之处在于,认为公司在技术即产品、全球化、高效率方面具有稀缺性 [6] - 潜在催化剂包括公司新版本模型发布以及行业技术演进 [7]
MiniMax稀宇科技薛子钊:AI大模型不是"砸钱游戏",国内大模型被严重低估|Alpha峰会
华尔街见闻· 2025-12-22 15:55
文章核心观点 - AI大模型行业与移动互联网有本质区别 其市场空间完全由模型智能水平驱动 且增长呈跳跃式而非连续性 每次智能跃升都会解锁全新应用场景和市场 [5][11][13] - 行业增长迅猛 全球头部模型层公司年化总收入已接近300亿美元 且月度环比保持双位数增长 但能持续发布全球领先模型的玩家数量却在减少 目前全球仅约10家 国内从“百模大战”演变为个位数公司竞争 [19][20][23] - 成功的核心壁垒并非单纯依赖资源堆砌 而在于能否构建高效的研发组织并持续创新 以跟上行业每3-6个月一次的快速迭代 资源雄厚的大厂若无法持续创新也会被淘汰 [6][20][22][23] - MiniMax是全球仅有的四家在语言、视频、声音三个模态均达到全球领先水平的公司之一 另外三家是OpenAI、谷歌和字节跳动 公司认为未来竞争将是全模态融合 [3][39] - MiniMax将超过80%的资源投入模型层和基础设施 视模型本身为核心产品 应用只是展示窗口 其战略是提供更高的“每块钱智能水平” 用更少资源做出更领先的模型 [3][30][38][40] 行业特点与趋势 - **市场驱动因素独特**:行业市场空间唯一的核心驱动因素是模型的智能水平 其提升是非连续性的跳跃 例如GPT-3.5到GPT-4的跃升 每次跃升都会解锁此前不可行的新场景 [11][13] - **增长飞轮效应**:模型智能提升解锁新场景 带来商业化收入 收入再投入研发推动智能进一步攀升 形成独特闭环 [14] - **颠覆性影响**:随着模型智能水平从L2提升至接近智能体的L3级别 许多传统软件工作流程可能被模型自主完成 导致部分SaaS公司从AI受益者变为潜在被替代对象 其市场被划入大模型范畴 [16] - **多模态渗透加速**:在视频生成领域 模型已用于辅助短剧制作和广告行业 在图像领域 专业修图场景正被AI取代 这些市场的渗透都随模型智能提升而进行 [17] - **玩家集中化**:尽管市场高速增长 但能留在模型层持续竞争的玩家数量在减少 全球仅约10家 国内从“百模大战”的百家公司减少到个位数 [20][23] MiniMax公司战略与成果 - **全模态布局**:公司自创立第一天起就同时研发语言、视觉和声音三个模态的大模型 旨在构建能通过图灵测试的全模态智能体 [25][26] - **研发高效性**:作为独立创业公司 其资源消耗与美国头部公司相差两个数量级 但通过更高的研发和资金使用效率 实现了快速迭代和突破 [38] - **全球化运营**:公司从第一天就是全球化公司 所有产品均服务全球用户 目前大部分商业化收入来自海外 [3][38] 各模态技术突破与市场地位 - **语言模型**:2024年10月发布的M2语言模型是全球开源模型中真实token用量最大的AI编程模型 成为首个真正切入该领域的国产模型 其用量相当于其他所有国产模型的总和 在该场景用量份额排全球第三 [3][32][34] - **视频模型**:海螺视频生成模型是全球用量最大的模型之一 与谷歌Veo、OpenAI Sora同属第一梯队 每天生成接近200万条视频 超过谷歌Veo上个季度公布的每日100多万条 [32][33] - **语音模型**:公司的语音模型已实现从文字生成语音的突破 技术表现曾达到全球第一 驱动了大量智能硬件、虚拟主播及有声书内容 在国内市场与字节跳动合计占据几乎全部份额 [31] 产品与应用 - **核心产品为模型**:公司认为底层模型是核心产品 而面向C端、B端和开发者的应用只是模型打包集成的渠道或展示窗口 [30] - **智能体应用**:公司推出的Agent智能体产品在调研、写报告等任务上已超越普通实习生水平 内部HR、财务、商务分析等部门已高度依赖 未来可能自主完成简历筛选、联系候选人甚至面试 [3][39] - **代表性产品**:包括海螺视频生成平台、陪伴类产品Talkie/星野 以及面向企业和开发者的开放平台 [30][38] 行业竞争与估值观察 - **技术差距缩小**:国内大模型公司在技术上已接近甚至在某些领域超越美国同行 且差距持续缩小 [3] - **估值严重低估**:国内公司与美国同行在估值上相差两个数量级 例如美国头部公司估值可能是中国公司的100倍 但技术领先可能只有5% 而投入却在50至100倍之间 相比之下国内公司研发效率更高但被严重低估 [3][38]
AI产业速递:从DeepSeek V3
2025-12-03 10:12
**行业与公司** * 行业涉及人工智能与大模型领域 重点包括强化学习 合成数据 稀疏化技术 注意力机制优化等方向[1] * 核心公司包括 Deepseek DeepMind OpenAI 以及提及的谷歌 阿里等大型科技公司[1][7][9] **Deepseek V3 2 模型的核心技术特点与改进** * 架构上引入 DSA 机制取代 MLA 机制 通过位置编码计算索引选取关键注意力参数 优化推理效率 尤其在复杂任务中减少冗长思维链的计算负担[1][3] * 后训练阶段的 C9 版本投入约10%的预训练计算量 显著提升模型在复杂任务(如代码调试)中的强化学习能力 达到全球领先水平[1][3][5] * 采用高效的上下文管理策略 智能处理用户频繁开启新任务 多轮对话及模糊输入 有效降低推理成本[1][3] * 使用大量人类专家编写并增量训练生成的高难度合成数据 比例较之前增加一倍以上 对后续强化学习阶段至关重要[1][3][4][6] * DSA 机制结合筛选和缓存技术 将 KV 缓存量降至50%以下 筛选机制可减少90%的 KV 缓存占比[18] * 在稠密阶段冻结部分参数 仅用少量参数(例如7 000亿参数模型中用20亿参数)进行初步规律提取 再进行稀疏训练 提高效率[18] **强化学习技术的最新发展与影响** * DeepMind 的新框架结合 Rubik‘s 规则提示机制 使系统能边思考边执行并根据环境反馈调整策略 提高了强化学习效率[8][9] * 该框架促使大型科技公司加速探索多模态视频和图像领域的应用 推动2025年相关模型发展[1][9] * 强化学习所需算力受数据条目数量 数据采样系数(简单任务为2-4倍 高难度任务可达128倍) 思维链输入输出长度等因素影响 浮动范围可达50倍[13][14] * 预计到2026或2027年 强化学习所需算力将接近预训练算力的一半 国内模型该比重可能达到20%至30%[15] **合成数据的作用与优势** * 合成数据比例大幅增加 其效果与难度系数密切相关 高难度 高质量的合成数据极大提升了模型在强化学习阶段的性能[6] * 在缺乏真实数据的极罕见长尾场景(如汽车高速碰撞)中 合成数据尤为重要 可通过智能体思维生成新个体和模拟环境来提升模型性能[16] **开源与闭源模型的趋势变化** * Deepseek 完成了全面的后训练过程并将结果开源 支持 Agent 调用能力 使得开源模型在功能上可与闭源模型媲美 可能引领开源项目新趋势[7] **稀疏化技术与未来模型价格趋势** * 稀疏化技术降低了训练算力要求并提升了训练上限 激发开发更大参数模型的动力[2][19] * 预计到2026年模型价格将大幅下降 可能降至现在的1/5 这将激发更多创业公司参与大模型开发[2][20] **预训练算力消耗现状与发展** * 全球主要厂商预训练算力需求显著提升 美国一些领先企业算力达10^25到10^26 FLOPS 相比 DeepMind(10^24 FLOPS)增长50到100倍[7] * 预训练算力需求增速趋缓 但通过基础设施效率提升(如TPU集群优化) 大规模预训练依然有发展潜力[17] **下一代大模型发展方向** * 发展方向集中在全模态融合(文本 图片 视频 音频) 与物理世界数据交互 以及具备更自适应推理机制 更强人机交互和长时间记忆能力[22] * V4 模型将基于现有高版本推进 重点验证和增强 Agent 功能[25] **大模型能力上限的迁移** * 后训练的潜力越来越大 模型能力上限正从预训练向后训练迁移 尤其在人文创意等没有固定答案的领域 其能力逐渐被打开将吸引更多应用厂商[10][11] **垂直场景中的应用示例** * 以电商平台AI万能搜索为例 通过多轮对话机制 基于用户历史数据 prompt响应和反馈数据 不断优化推荐结果 满足个性化需求[12]