Cloud 4.6
搜索文档
国产大模型及Agent动态更新
2026-03-04 22:17
国产大模型及Agent动态更新20260304 - 关键要点总结 一、 行业与公司 * 涉及行业为人工智能大模型与AI Agent行业,具体包括国产大模型厂商、海外模型厂商及算力产业链[1] * 涉及的公司包括国产模型厂商Kimi、Minimax、深度求索(Deepseek)、智谱AI(GLM),以及海外模型厂商Anthropic、OpenAI[2][3][4][5] * 产业链关注点包括算力租赁、小云厂、IDC等A股相关公司[14] 二、 市场表现与增长信号 * 2026年初,国内外模型年度经常性收入(AR)与Token消耗进入爆发期[1][2] * **海外侧**:Anthropic的AR从2025年12月的约90亿美元,跃升至2026年1月的约140亿美元,并在2026年2月进一步提升至约200亿美元,核心驱动来自Claude Code等产品[2] * **国内侧**:Kimi在2026年1月前20天的营收已超过其2025年全年总和[1][2];Minimax披露其2026年2月AR超过1.5亿美元[1][2] 三、 国产模型竞争力与市场份额跃迁 * 国产模型在OpenRouter平台的流量占比出现两次关键跃迁[3] * 第一次在2025年12月,伴随Deepseek V3.2发布,其DSA架构使长文本输出的token价格降至原来的1/7,国产模型占比提升至约10%-20%[3] * 第二次在2026年1月,伴随GLM 5发布,国产模型token消耗占比从约15%-20%提升至约25%[3] * 市场预期Deepseek V4的发布有望将国产模型在相关平台的占比从约25%推升至30%甚至40%以上[4] 四、 模型技术架构与“价格最优解”趋势 * 在有限算力供给约束下,国内模型架构呈现向“价格最优解”收敛的趋势,市场逐步找到1万亿参数规模以下的最优组合[4] * 模型能力提升节奏:未来两个月,1万亿参数规模以下的国内模型能力预计进入密集提升周期,尤其在coding领域正逐步逼近最优性价比组合[4] 五、 国产Coding模型能力评估与演进路径 * **全球相对位置**:从2026年1月的SWE Revenge测试集观察,国产模型大多得分在40分以上,海外领先模型如Claude 4.6、GPT 5.3在50分以上,国产模型整体大致相当于海外2025年10月左右的水平[5] * **差距来源**:主要来自两到三倍的参数规模差异以及数据质量差异[6] * **当前分工**:现实工作流中,常使用海外模型完成较大的代码框架编写,再由国产模型完成具体模块的编译,以获得更高性价比[6] * **演进路径**:随着国产模型参数规模从1万亿向1.4-1.5万亿、再向2万亿演进,其抽象构思能力增强,有望逐步参与到更高价值量的“大框架编写”环节[6] * **市场空间**:海外Coding模型(如Anthropic)到2022年年底可能达到约500亿美元AR的层级,这被视为国产模型市场空间的上限参考[7] 六、 AI Agent体验跃升的核心驱动 * **训练数据结构变化**:2025年开始,训练数据中混入更多“符合人类偏好”的数据(如报告结构、PPT审美数据),使模型输出更拟人化,目标可达人类输出的80%甚至90%[8][9] * **工具调用工程化跃迁**:这是2025年至2026年Agent体验发生“翻天覆地”变化的核心驱动[8] * **2025年痛点**:工具定义与说明挤占大量上下文。以128K上下文为例,工具调用可能占用60-80K,仅剩30-40K用于文本输出,导致Agent通常只能执行3-5个任务,且调用失败率高[10] * **工程化改进**:2025年11月,Anthropic推出scale机制,将工具库内容迁移到本地文件,仅向模型保留简洁描述。这使有效上下文从约30-40K提升到100K以上,调用成功率显著提升[11] * **能力量化变化**:Agent从过去跑3-5步就失败,提升到可运行10步以上,甚至支持执行持续约20分钟的任务[11] 七、 Agent技术发展方向 * **记忆系统**:OmniCloth采用本地两层记忆系统实现“千人千面”,第一层记录每日对话记忆,第二层对历史记录进行统一摘要,用较简单的机制实现个性化效果[12] * **Multi-Agent/Agent集群**:2026年的核心价值是通过对不同Agent分工,确保每个Agent上下文足够纯净,避免多任务导致的上下文污染,让每个子系统更稳定地发挥接近人类80%-90%的输出质量[13] 八、 2026年产业趋势总判断与投资关注点 * **总判断**:2026年被定义为算力投入与模型收入产出循环“第一次真正转起来”的一年,国内外模型厂收入有望继续极高速增长,且增速可能显著超出市场预期[14] * **A股关注点**:主要集中在国产算力链条,包括算力租赁、具备H100/H20等服务器现货的小云厂、以及服务器上线后存在大量放置需求的IDC等环节[14] * **海外循环与出海机会**:海外侧的“算力投入-产出”循环可能比国内更明显、兑现更早。2026年存在一些从0到1的出海方向,整体判断偏积极[15] * **ROI担忧缓解**:资本市场此前对投资回报率(ROI)的担忧,预计在2026年得到较好解决,2026年上半年将看到AI Agent与模型性能提升及变现落地的进一步发展[15]
AI应用正当时-模型进入需求时代
2026-02-13 10:17
行业与公司 * 涉及的行业为人工智能(AI)产业,特别是大模型与应用领域[1] * 涉及的公司包括:智谱(GLM)、MinMax、kimi、Anthropic、阿里(云)、字节(豆包)、腾讯、税友、中控、合合、金山办公、金山云、首都在线、深信服等[2][5][11] 核心观点与论据 * **国内模型能力实现关键突破,进入“需求时代”**:智谱GLM 5的发布显著提升了国内模型在coding和agent领域的能力,标志着从补足代码到执行任务阶段的转变,为商业化应用奠定基础[2][3] * **模型能力是应用增长的核心驱动力**:以Anthropic为例,其ARR从2023年的1亿美金增长至2024年的10亿美金和2025年的100亿美金,这种增长与新一代模型的发布密切相关[3] * **国内AI产业进入新阶段,获全球认可**:2025年下半年,GLM、MinMax、kimi等模型被广泛调用,主要得益于国内AI服务价格远低于海外,即使涨价后价格仍仅为海外同类服务的1/5[2][5] * **智谱GLM 5成功的原因**:背靠清华大学获得强大技术支持,团队人才密度高;在编程和光影渲染等复杂任务中表现出色;积极支持国产算力,促进产业链发展[2][6] * **AI模型与办公工具结合趋势加速**:从2026年开始,国内AI模型与办公工具的结合将越来越普遍,例如智谱推出的GLM in Excel功能,将改变传统的资料搜集、数据整理和表格呈现过程[2][7] * **国内模型价格显著上涨,但性价比优势依然突出**:智谱新模型发布后,API及订阅价格显著上涨,例如GLM5和GLM Code基础级输入价格分别为4元和6元,输出价格最基础的每百万Token收费提升了125%和250%,Coding Max版本月费为469元,相较于Pro版本提高了215%[2][8];尽管如此,其价格仍仅为海外同类产品的五分之一,在全球市场具有明显竞争优势[4][9] * **AI发展驱动云计算需求增长**:随着用户对AI应用需求增加,对云计算资源的需求也随之增长,预计2026年云服务将出现量价齐升,智谱等厂商将在Token调用量及平台收入上实现显著增长[4][10] 其他重要内容 * **未来值得关注的领域**:首先是AI模型公司(智谱、MinMax、阿里、字节系、腾讯等);其次是Agent层面的应用公司(税友、中控、合合、金山办公等);最后是云计算领域公司(阿里云、首都在线、金山云、深信服等)[11] * **国内模型技术逐渐赶上国际先进水平**:智谱GLM 5已成为直逼OPPO 4.7、OPPO 4.6等顶级国际模型的重要力量[6]