国产大模型及Agent动态更新
2026-03-04 22:17

国产大模型及Agent动态更新20260304 - 关键要点总结 一、 行业与公司 * 涉及行业为人工智能大模型与AI Agent行业,具体包括国产大模型厂商、海外模型厂商及算力产业链[1] * 涉及的公司包括国产模型厂商Kimi、Minimax、深度求索(Deepseek)、智谱AI(GLM),以及海外模型厂商Anthropic、OpenAI[2][3][4][5] * 产业链关注点包括算力租赁、小云厂、IDC等A股相关公司[14] 二、 市场表现与增长信号 * 2026年初,国内外模型年度经常性收入(AR)与Token消耗进入爆发期[1][2] * 海外侧:Anthropic的AR从2025年12月的约90亿美元,跃升至2026年1月的约140亿美元,并在2026年2月进一步提升至约200亿美元,核心驱动来自Claude Code等产品[2] * 国内侧:Kimi在2026年1月前20天的营收已超过其2025年全年总和[1][2];Minimax披露其2026年2月AR超过1.5亿美元[1][2] 三、 国产模型竞争力与市场份额跃迁 * 国产模型在OpenRouter平台的流量占比出现两次关键跃迁[3] * 第一次在2025年12月,伴随Deepseek V3.2发布,其DSA架构使长文本输出的token价格降至原来的1/7,国产模型占比提升至约10%-20%[3] * 第二次在2026年1月,伴随GLM 5发布,国产模型token消耗占比从约15%-20%提升至约25%[3] * 市场预期Deepseek V4的发布有望将国产模型在相关平台的占比从约25%推升至30%甚至40%以上[4] 四、 模型技术架构与“价格最优解”趋势 * 在有限算力供给约束下,国内模型架构呈现向“价格最优解”收敛的趋势,市场逐步找到1万亿参数规模以下的最优组合[4] * 模型能力提升节奏:未来两个月,1万亿参数规模以下的国内模型能力预计进入密集提升周期,尤其在coding领域正逐步逼近最优性价比组合[4] 五、 国产Coding模型能力评估与演进路径 * 全球相对位置:从2026年1月的SWE Revenge测试集观察,国产模型大多得分在40分以上,海外领先模型如Claude 4.6、GPT 5.3在50分以上,国产模型整体大致相当于海外2025年10月左右的水平[5] * 差距来源:主要来自两到三倍的参数规模差异以及数据质量差异[6] * 当前分工:现实工作流中,常使用海外模型完成较大的代码框架编写,再由国产模型完成具体模块的编译,以获得更高性价比[6] * 演进路径:随着国产模型参数规模从1万亿向1.4-1.5万亿、再向2万亿演进,其抽象构思能力增强,有望逐步参与到更高价值量的“大框架编写”环节[6] * 市场空间:海外Coding模型(如Anthropic)到2022年年底可能达到约500亿美元AR的层级,这被视为国产模型市场空间的上限参考[7] 六、 AI Agent体验跃升的核心驱动 * 训练数据结构变化:2025年开始,训练数据中混入更多“符合人类偏好”的数据(如报告结构、PPT审美数据),使模型输出更拟人化,目标可达人类输出的80%甚至90%[8][9] * 工具调用工程化跃迁:这是2025年至2026年Agent体验发生“翻天覆地”变化的核心驱动[8] * 2025年痛点:工具定义与说明挤占大量上下文。以128K上下文为例,工具调用可能占用60-80K,仅剩30-40K用于文本输出,导致Agent通常只能执行3-5个任务,且调用失败率高[10] * 工程化改进:2025年11月,Anthropic推出scale机制,将工具库内容迁移到本地文件,仅向模型保留简洁描述。这使有效上下文从约30-40K提升到100K以上,调用成功率显著提升[11] * 能力量化变化:Agent从过去跑3-5步就失败,提升到可运行10步以上,甚至支持执行持续约20分钟的任务[11] 七、 Agent技术发展方向 * 记忆系统:OmniCloth采用本地两层记忆系统实现“千人千面”,第一层记录每日对话记忆,第二层对历史记录进行统一摘要,用较简单的机制实现个性化效果[12] * Multi-Agent/Agent集群:2026年的核心价值是通过对不同Agent分工,确保每个Agent上下文足够纯净,避免多任务导致的上下文污染,让每个子系统更稳定地发挥接近人类80%-90%的输出质量[13] 八、 2026年产业趋势总判断与投资关注点 * 总判断:2026年被定义为算力投入与模型收入产出循环“第一次真正转起来”的一年,国内外模型厂收入有望继续极高速增长,且增速可能显著超出市场预期[14] * A股关注点:主要集中在国产算力链条,包括算力租赁、具备H100/H20等服务器现货的小云厂、以及服务器上线后存在大量放置需求的IDC等环节[14] * 海外循环与出海机会:海外侧的“算力投入-产出”循环可能比国内更明显、兑现更早。2026年存在一些从0到1的出海方向,整体判断偏积极[15] * ROI担忧缓解:资本市场此前对投资回报率(ROI)的担忧,预计在2026年得到较好解决,2026年上半年将看到AI Agent与模型性能提升及变现落地的进一步发展[15]

国产大模型及Agent动态更新 - Reportify