报告行业投资评级 - 投资评级:优于大市(维持)[1] 报告核心观点 - 自2026年以来,全球模型进入Agent智能体交互时代,驱动Tokens调用量爆发,中国AI大模型调用量已连续五周超越美国,国产模型正在崛起[2] - 国产模型的核心优势在于极致的性价比,通过工程化、数据能力优化和轻量化架构创新来弥补算力限制,并以接近成本价的定价策略换取市场份额[2] - 大模型的商业模式与传统互联网不同,用户网络效应和飞轮效应较弱,模型智力水平是驱动用户和商业化收入增长的最重要因素[2] - 行业正从通用榜单评估转向以业务价值为核心的私有化、场景化自定义评测体系,模型厂商开始构建自己的底层评测基准[26] - 全球头部模型已进入自训练、自进化阶段,能够通过自我优化的闭环系统持续提升能力[27][29] - AI Agent时代将改变用户获取服务的方式,从“人找App”转向“AI自主发现/调用技能”,服务入口和分发模式去中心化[34] 行业发展趋势 - 大模型进入Agent时代:2026年大模型正式从对话走向智能体交互,Agent通过包装大模型并加上记忆、规划和工具使用能力,能够自主完成任务[8][10] - Token需求非线性增长:任务复杂度提升(从对话到智能体、视频)推动Token消耗呈指数级增长。例如,单Agent任务Token消耗是普通对话的4倍,多Agent协作可达15倍;生成15秒视频消耗30.9万Token,是普通对话的21倍[11][12] - 全球企业AI采用率快速提升:自2025年起,美国企业AI采用量总体达48%,其中OpenAI占34%,Anthropic占24%[21] - 中国市场调用量激增:截至2026年3月,中国国内日均Token调用量已突破140万亿,增长超1400倍[21] - Agent关键能力构成:包括记忆能力(取决于架构设计与工程)、规划能力(取决于架构与数据)、工具调用能力(短期取决于工程化,长期取决于数据精度)[23] - 技术架构收敛:在Transformer/MoE架构未发生颠覆性变革的背景下,架构红利边际递减,工程化能力与高质量数据成为提升能力的关键[24] - 模型自进化趋势:全球头部模型通过自训练实现自我进化,例如MiniMax的M2.7模型可执行超过100轮“分析-改进-验证”循环,实现约30%的效果提升[29] - 入口形态变迁:AI时代从“对话助手”向“执行员工”范式跃迁,OpenClaw等智能体操作系统的出现标志着能力供给和分发模式去中心化[34] - 商业模式拓展:大模型基座通过出售算力(Token)和调用许可收费,同时开始探索广告模式,例如OpenAI计划到2030年广告收入达到1000亿美元[36][37] - 工程范式演进:从提示词工程(Prompt Engineering)、上下文工程(Context Engineering)演进到驾驭工程(Harness Engineering),以管控Agent在复杂工作流中的自主运行[38][39][40] 主要模型公司对比与总结 - OpenAI:最新模型GPT-5.4,激活参数2000亿+,上下文窗口1.05M tokens,API价格(输入/输出)为$2.50/$15.00每百万token,2026年3月年度经常性收入(ARR)达250亿美元,通过2C场景打造核心壁垒,发力企业与多模态[4] - Anthropic:最新模型Claude 4.5,激活参数1000亿+,上下文窗口1M tokens,API价格为$3.00/$15.00,2026年4月ARR达300亿美元,超越OpenAI,坚持2B路线和Coding场景[4][10] - DeepSeek:最新模型DeepSeek V3.2,总参数6710亿,激活参数370亿,上下文窗口128K,API价格$0.27/$0.42,性价比突出,组织架构扁平,算法架构积极创新(如DeepSeekMoE、MLA注意力技术),开源为国产模型提供基石,商业化压力小[2][4][52] - 智谱AI:最新模型GLM-5,总参数7440亿,激活参数400亿,上下文窗口200K,API价格$1.00/$3.20,2026年3月API平台ARR达2.5亿美元,学术背景强、全栈自研、幻觉率低(GLM-4-9B幻觉率1.3%),拥抱国产算力[4][90] - 月之暗面(Kimi):最新模型Kimi-K2.5,总参数1万亿,激活参数328.6亿,上下文窗口262K,API价格$0.6/$3.0,2026年2月ARR达1亿美元,长上下文能力是核心优势,拥有智能体集群(Agent Swarm)技术[4][114][115] - MiniMax:最新模型M2.7,总参数2300亿,激活参数100亿,上下文窗口205K,API价格$0.3/$1.20,2026年2月ARR达1.5亿美元,质价比突出,积极拥抱全球模型变化,是亚洲首家实现MoE基础模型架构商业化的公司[4][67][70] - 阿里巴巴:最新模型Qwen3.5,总参数3970亿,激活参数170亿,上下文窗口可扩展至1M,API价格$0.6/$3.6,2026年预计AI云收入约500亿元(包括MaaS),开源全家桶,架构创新驱动,在国内首先实现原生多模态[4] - 腾讯控股:最新模型Tencent HY2.0,总参数4060亿,激活参数320亿,上下文窗口256K,API价格¥4.505/¥11.13,在3D生成、图片、世界建模多模态方面有优势,组织调整为AI原生驱动[4][7] - 字节跳动:最新模型豆包2.0,上下文窗口256K,API价格(Pro版)¥3.20/¥16.0,2026年预计MaaS收入100亿+,多模态、视觉理解有优势,通过深度定制工程栈和性价比抢占份额[4] - 小米:最新模型MiMo V2Pro,总参数1万亿,激活参数420亿,上下文窗口1M,API价格(小于256K)$1/$3,模型与终端产品融合[4] 国产模型核心优势与挑战 - 性价比优势显著:国产模型输入输出价格仅为Claude/GPT的1/5至1/30,最具性价比的为MiniMax和DeepSeek[50] - 技术降本路径: - 架构轻量化优化:如DeepSeek独创MoE架构使总参数仅激活5.5%,MLA技术将KV Cache显存占用降至传统架构的1/10[52] - 长上下文链路优化:Kimi、MiniMax等厂商创始初期即锚定长上下文路线,进行全链路成本优化[52] - 算力平替与调度:擅长利用碎片化算力资源(如国产芯片)通过集群调度发挥最大效能[52] - AI基础设施优势:国内电、人工成本更低,算力中心建设周期短[52] - 主要挑战: - 推理深度较弱:在算力约束下,多采用思维链(CoT)而非思维树(ToT),推理深度和强度弱于海外[55] - 数据集质量与生态:标注质量参差不齐,缺少“需求-推理-调用-结果-反馈”全链路闭环数据;开源生态较弱,数据更新迭代滞后[55][56] 重点公司分析 MiniMax - 全球化布局与收入:从创业初期即着眼全球市场,海外收入占比73%(2025年上半年),新加坡和美国是主要海外市场[2][72][74] - 技术前瞻性:管理层敢于实验新技术,如早期布局MoE架构、线性注意力(Linear Attention)并率先规模化落地[64][67] - 商业化与增长:开放平台收入增长迅猛,预计2028年占比达66%,2026年2月ARR超过1.5亿美元,Token调用量增长超6倍[70][82][84] - 迭代方向:2026年聚焦编程、办公、多模态三大核心赛道,深耕生产力场景[75][81] 智谱AI - 技术特色与定位:脱胎于清华实验室,坚持AGI长期主义,追求技术稳定性与可控性,是国内开源大模型核心标杆[85][86] - 国产算力适配:全面推进算力供应链国产替代,GLM-5原生适配七大主流国产芯片平台,计划2026年中发布与国产芯片协同设计的ASIC成果[98] - 商业模式与增长:云端MaaS(模型即服务)成为核心增长引擎,2026年3月API平台ARR突破2.5亿美元,预计年底突破10亿美元,并对Coding Plan套餐提价30%[100][103][110] - 市场地位:Artificial Analysis榜单中GLM-5.1位居全球第六、国内模型第一,发布行业首个OpenClaw专属模型GLM-5-Turbo及场景化评测基准ZClawBench[93] 月之暗面(Kimi) - 技术信仰与边界:创始源于对AGI的好奇,核心技术信仰是长上下文能力,业务专注生产力场景,不做生活娱乐和多模态生成[113] - 核心能力壁垒:长上下文原生先发优势,以及Agent Swarm智能体集群技术,可调度最多100个子智能体并行执行[114][115] - 商业化进展:B端和C端双轮驱动,2026年1月底以来约20天累计收入已超2025年全年,ARR突破1亿美元,海外收入贡献已超过国内[116][120] - 迭代方向:聚焦Token效率、长上下文和智能体集群三个维度的共振,优化编程、办公自动化、深度科研场景[121][124] DeepSeek - 发展理念:背靠幻方量化,商业化压力小,早期重视前沿基础研究和开源,致力于成为基础模型生态的提供者[2][126] - 架构创新:是国产大模型底层技术突破的先行者,其DeepSeekMoE架构和MLA多头潜在注意力技术大幅提升了模型效率[52][131] - 近期重点:发力原生多模态融合与国产算力深度适配,预计2026年4月发布的DeepSeek V4将优先支持国产芯片生态[130]
人工智能行业专题(16):Agent驱动全球模型厂MaaS收入爆发,国产模型各有优势
国信证券·2026-04-17 22:57