Cloud 4.6 - 财报，业绩电话会，研报，新闻

Cloud 4.6

搜索文档

2026-03-04 22:17

国产大模型及Agent动态更新20260304 - 关键要点总结一、行业与公司 * 涉及行业为人工智能大模型与AI Agent行业，具体包括国产大模型厂商、海外模型厂商及算力产业链[1] * 涉及的公司包括国产模型厂商Kimi、Minimax、深度求索(Deepseek)、智谱AI(GLM)，以及海外模型厂商Anthropic、OpenAI[2][3][4][5] * 产业链关注点包括算力租赁、小云厂、IDC等A股相关公司[14] 二、市场表现与增长信号 * 2026年初，国内外模型年度经常性收入(AR)与Token消耗进入爆发期[1][2] * **海外侧**：Anthropic的AR从2025年12月的约90亿美元，跃升至2026年1月的约140亿美元，并在2026年2月进一步提升至约200亿美元，核心驱动来自Claude Code等产品[2] * **国内侧**：Kimi在2026年1月前20天的营收已超过其2025年全年总和[1][2]；Minimax披露其2026年2月AR超过1.5亿美元[1][2] 三、国产模型竞争力与市场份额跃迁 * 国产模型在OpenRouter平台的流量占比出现两次关键跃迁[3] * 第一次在2025年12月，伴随Deepseek V3.2发布，其DSA架构使长文本输出的token价格降至原来的1/7，国产模型占比提升至约10%-20%[3] * 第二次在2026年1月，伴随GLM 5发布，国产模型token消耗占比从约15%-20%提升至约25%[3] * 市场预期Deepseek V4的发布有望将国产模型在相关平台的占比从约25%推升至30%甚至40%以上[4] 四、模型技术架构与“价格最优解”趋势 * 在有限算力供给约束下，国内模型架构呈现向“价格最优解”收敛的趋势，市场逐步找到1万亿参数规模以下的最优组合[4] * 模型能力提升节奏：未来两个月，1万亿参数规模以下的国内模型能力预计进入密集提升周期，尤其在coding领域正逐步逼近最优性价比组合[4] 五、国产Coding模型能力评估与演进路径 * **全球相对位置**：从2026年1月的SWE Revenge测试集观察，国产模型大多得分在40分以上，海外领先模型如Claude 4.6、GPT 5.3在50分以上，国产模型整体大致相当于海外2025年10月左右的水平[5] * **差距来源**：主要来自两到三倍的参数规模差异以及数据质量差异[6] * **当前分工**：现实工作流中，常使用海外模型完成较大的代码框架编写，再由国产模型完成具体模块的编译，以获得更高性价比[6] * **演进路径**：随着国产模型参数规模从1万亿向1.4-1.5万亿、再向2万亿演进，其抽象构思能力增强，有望逐步参与到更高价值量的“大框架编写”环节[6] * **市场空间**：海外Coding模型（如Anthropic）到2022年年底可能达到约500亿美元AR的层级，这被视为国产模型市场空间的上限参考[7] 六、 AI Agent体验跃升的核心驱动 * **训练数据结构变化**：2025年开始，训练数据中混入更多“符合人类偏好”的数据（如报告结构、PPT审美数据），使模型输出更拟人化，目标可达人类输出的80%甚至90%[8][9] * **工具调用工程化跃迁**：这是2025年至2026年Agent体验发生“翻天覆地”变化的核心驱动[8] * **2025年痛点**：工具定义与说明挤占大量上下文。以128K上下文为例，工具调用可能占用60-80K，仅剩30-40K用于文本输出，导致Agent通常只能执行3-5个任务，且调用失败率高[10] * **工程化改进**：2025年11月，Anthropic推出scale机制，将工具库内容迁移到本地文件，仅向模型保留简洁描述。这使有效上下文从约30-40K提升到100K以上，调用成功率显著提升[11] * **能力量化变化**：Agent从过去跑3-5步就失败，提升到可运行10步以上，甚至支持执行持续约20分钟的任务[11] 七、 Agent技术发展方向 * **记忆系统**：OmniCloth采用本地两层记忆系统实现“千人千面”，第一层记录每日对话记忆，第二层对历史记录进行统一摘要，用较简单的机制实现个性化效果[12] * **Multi-Agent/Agent集群**：2026年的核心价值是通过对不同Agent分工，确保每个Agent上下文足够纯净，避免多任务导致的上下文污染，让每个子系统更稳定地发挥接近人类80%-90%的输出质量[13] 八、 2026年产业趋势总判断与投资关注点 * **总判断**：2026年被定义为算力投入与模型收入产出循环“第一次真正转起来”的一年，国内外模型厂收入有望继续极高速增长，且增速可能显著超出市场预期[14] * **A股关注点**：主要集中在国产算力链条，包括算力租赁、具备H100/H20等服务器现货的小云厂、以及服务器上线后存在大量放置需求的IDC等环节[14] * **海外循环与出海机会**：海外侧的“算力投入-产出”循环可能比国内更明显、兑现更早。2026年存在一些从0到1的出海方向，整体判断偏积极[15] * **ROI担忧缓解**：资本市场此前对投资回报率(ROI)的担忧，预计在2026年得到较好解决，2026年上半年将看到AI Agent与模型性能提升及变现落地的进一步发展[15]

Artificial Intelligence

Artificial Intelligence

OmniCloth

AI应用正当时-模型进入需求时代

2026-02-13 10:17

行业与公司 * 涉及的行业为人工智能（AI）产业，特别是大模型与应用领域[1] * 涉及的公司包括：智谱（GLM）、MinMax、kimi、Anthropic、阿里（云）、字节（豆包）、腾讯、税友、中控、合合、金山办公、金山云、首都在线、深信服等[2][5][11] 核心观点与论据 * **国内模型能力实现关键突破，进入“需求时代”**：智谱GLM 5的发布显著提升了国内模型在coding和agent领域的能力，标志着从补足代码到执行任务阶段的转变，为商业化应用奠定基础[2][3] * **模型能力是应用增长的核心驱动力**：以Anthropic为例，其ARR从2023年的1亿美金增长至2024年的10亿美金和2025年的100亿美金，这种增长与新一代模型的发布密切相关[3] * **国内AI产业进入新阶段，获全球认可**：2025年下半年，GLM、MinMax、kimi等模型被广泛调用，主要得益于国内AI服务价格远低于海外，即使涨价后价格仍仅为海外同类服务的1/5[2][5] * **智谱GLM 5成功的原因**：背靠清华大学获得强大技术支持，团队人才密度高；在编程和光影渲染等复杂任务中表现出色；积极支持国产算力，促进产业链发展[2][6] * **AI模型与办公工具结合趋势加速**：从2026年开始，国内AI模型与办公工具的结合将越来越普遍，例如智谱推出的GLM in Excel功能，将改变传统的资料搜集、数据整理和表格呈现过程[2][7] * **国内模型价格显著上涨，但性价比优势依然突出**：智谱新模型发布后，API及订阅价格显著上涨，例如GLM5和GLM Code基础级输入价格分别为4元和6元，输出价格最基础的每百万Token收费提升了125%和250%，Coding Max版本月费为469元，相较于Pro版本提高了215%[2][8]；尽管如此，其价格仍仅为海外同类产品的五分之一，在全球市场具有明显竞争优势[4][9] * **AI发展驱动云计算需求增长**：随着用户对AI应用需求增加，对云计算资源的需求也随之增长，预计2026年云服务将出现量价齐升，智谱等厂商将在Token调用量及平台收入上实现显著增长[4][10] 其他重要内容 * **未来值得关注的领域**：首先是AI模型公司（智谱、MinMax、阿里、字节系、腾讯等）；其次是Agent层面的应用公司（税友、中控、合合、金山办公等）；最后是云计算领域公司（阿里云、首都在线、金山云、深信服等）[11] * **国内模型技术逐渐赶上国际先进水平**：智谱GLM 5已成为直逼OPPO 4.7、OPPO 4.6等顶级国际模型的重要力量[6]