国联民生证券:模型单位成本重要性不断提升 多模态与“视觉执行”走向前台
智通财经网·2026-02-04 14:26

行业范式转变:从对话到工作流 - 大模型正从“聊天工具”进化为“自主员工”,进入Agent时代 [1] - 传统对话范式下单次交互仅需少数几次模型调用,而工作流范式下的复杂任务横跨计划、检索、工具调用、校验纠错及外部系统写入等多个阶段 [1][2] - 相较基础聊天,面向复杂任务的Agent服务可能会消耗数十倍多的token,模型调用频率、上下文长度及中间信息复杂程度倍增 [1][2] 核心驱动因素:成本与效率 - Agent类产品规模化落地的关键取决于“模型的单位成本×单位产出”,多轮推理与工具协同会将成本线性放大 [2] - 近期出现的“AI-only社区”如Moltbook在极短时间内聚集了百万个代理账号规模,对应更高的API请求密度与更频繁的API触发 [1] - 开源项目Clawdbot在GitHub上的星标数量已超过13万个,官网累计访问量突破200万人次,成为近期增长最快的开源技术项目之一 [1] 公司分析:MiniMax的竞争优势 - MiniMax的M2.1模型被Clawdbot创始人Peter Steinberger力荐,因其兼具效率与成本的优势、长文本能力强、推理与编程能力 [1][2] - M2.1模型的定价体系约为Claude Sonnet的8%,旨在解决自动化编程中的高昂token成本痛点 [3] - 公司采用分层月度订阅制,而非行业通用的token按量计费模式,其Coding Plan引入“每5小时重置额度”的高频刷新机制,打破了按天或按月限额的行业模式 [3] - M2.1的长文本能力使其更适合完成“持续记忆”,能读更长的文档、容纳更多中间结果,减少逻辑断裂 [3] - 在推理与编程能力上,M2.1“够用且性价比极高”,适合被高频调用于写代码、改代码、做判断、做校验的生产系统 [3] 技术趋势:多模态与视觉执行 - Agent进入办公与生产场景后,输入大量来自截图、PDF、表格、图表、界面元素等视觉信息 [4] - MiniMax的多模态能力辅助Agent更好地理解界面、提取关键信息、输出可执行步骤,并用截图回读做校验纠错,实现“视觉驱动的自动化” [4] - 具体应用包括识别表格字段后自动填表、读报错截图后定位原因并改脚本、从图表中抽数并写入报告、对比前后截图确认任务完成等 [4] 投资观点 - 掌握核心算法与行业接口的大模型厂商有望深度受益于万物智能化的红利 [1] - 在Agent时代,“谁能以更低成本把强能力变成高频可用的生产力”比“谁更聪明”更重要,这是MiniMax的优势所在 [3] - 建议关注“大模型双子星”MiniMax-WP(00100)与智谱(02513) [1]

国联民生证券:模型单位成本重要性不断提升 多模态与“视觉执行”走向前台 - Reportify