Llama 4 Scout - 财报，业绩电话会，研报，新闻

Llama 4 Scout

搜索文档

2026年投资峰会速递：AI产业新范式

华泰证券· 2025-11-10 20:07

行业投资评级 - 科技行业评级为“增持”（维持）[7] - 计算机行业评级为“增持”（维持）[7] 核心观点 - AI产业正经历从模型、训练到应用的全方位范式革新，行业演进加速 [2] - Scaling Law 2.0时代下，合成数据与Mid Training范式重塑模型演进路径，算力扩张仍是核心增长引擎 [2][3] - AI应用商业化步入规模化阶段，Agent能力与交易闭环融合带动产业落地加速 [2][6] 模型层：算力与数据驱动演进 - 算力扩张是行业核心增长引擎，2010-2024年代表性模型训练算力年均增长4-5倍，头部模型达9倍水平 [3][13] - 合成数据持续扩大训练资源池，典型开源模型训练数据常见于10-15万亿tokens，头部厂商通过新方法持续扩容，例如阿里Qwen系列从18万亿tokens提升至36万亿tokens [3][12] - 预计前沿模型单次完整训练成本或在2027年达到十亿美元量级 [3][13] 训练层：Mid Training范式突破 - Mid Training成为Scaling Law 2.0重要标志，通过将强化学习前移至中间环节，实现算力对数据的自我生成与最优分配 [4][16] - 该范式在多智能体辩论等机制下生成数据量远超人工标注，并通过动态权重分配提升强化学习训练质量与数据利用率 [4][16] - Mid Training的应用有望突破传统Scaling Law下的性能边界，打开模型能力上限 [4][16] 智能体层：架构标准化趋势 - GPT-5以统一架构实现快思与深思的自适应协同，并通过实时路由器按任务复杂度动态分配算力资源 [5][19] - 该“统一系统”范式代表行业向“多模型一体化、动态资源分配”方向演进，DeepSeek V3.1与Grok 4 Fast等产品快速跟进验证此趋势 [5][19] - 该架构有望显著提升智能体在复杂场景中的响应效率与稳定性 [5] 应用层：商业化规模化加速 - 头部厂商战略重心从模型能力转向商业化生态构建，OpenAI推出Agentic Commerce Protocol，使AI Agent具备直接交易能力，实现从“推荐”到“结算”的全链路闭环 [6][22] - 全球AI应用正经历产品化（2023）→商业化试点（2024）→规模化落地（2025）三阶段演进 [6][25] - 海外厂商已进入规模化放量初期，国内厂商受益于DeepSeek-R1等模型突破，应用节奏显著加快，部分AI应用（如深度研究、企业问数）已具备大规模商业化能力 [6][26] - Agent与交易协议的深度结合、ROI体系的持续明晰，正推动AI应用产业价值释放进入加速期 [6]

机器之心· 2025-07-16 12:21

大型语言模型记忆能力与上下文窗口核心观点 - 现代大型语言模型(LLM)存在内在的「记忆缺陷」，上下文窗口有限导致难以维持长期一致性 [5][6] - 长上下文处理能力与记忆能力密切相关，但上下文窗口不等同于记忆 [11][34] - 新兴记忆管理系统借鉴操作系统架构，实现更持久的LLM记忆 [48][50][54] 上下文窗口演变 - 早期GPT-3仅支持2,048 token，近期模型如Llama 4 Scout可达1,000万token [2][4] - 上下文窗口扩展面临长度泛化、高效注意力、信息保留等挑战 [12][13][14] 记忆分类体系 - **短期记忆**：当前推理可见的历史文本，用于文档问答/多轮对话 [16] - **长期记忆**包含： 1) 事件记忆-记录代理操作历史 [18] 2) 语义记忆-整合外部知识与自我认知 [19] 3) 程序性记忆-系统运行机制与行为边界 [20] 提升记忆能力的技术路径 - **长上下文方法**： 1) RAG实现动态知识检索，减少幻觉 [27][28] 2) 分层摘要处理超长文本但易累积错误 [31] 3) 滑动窗口推理结合次级模型整合 [32] - **记忆系统架构**： 1) 固定记忆池(MemoryLLM)限制容量避免无限增长 [36][37] 2) 非固定记忆池采用键值对/隐藏向量等灵活形式 [41][42] 代表性记忆系统 - MemGPT借鉴操作系统分页机制管理虚拟内存 [50][52] - MemOS采用工业级分层架构融合Memory3技术 [52][54] - MemoryOS实现三级分层存储体系(实时/主题/个性化) [54][56] - MIRIX首创多模态多智能体记忆系统 [58][63] - Larimar受人类情景记忆启发构建分层框架 [60][64]