应用趋势 - 通用类Agent产品深度整合工具使用,主打完成场景多样的深度研究类任务,交付内容更加丰富,成为2025上半年应用亮点 [1][11] - 以视觉操作为核心的Computer Use Agent (CUA)开始推向市场,正与基于文本的深度研究类Agent融合 [1][11][14] - 垂直应用场景开始Agent化,自然语言操控功能成为垂类工作流的一部分 [1][16] - AI编程成为当前最核心的垂类应用领域,头部编程应用收入增长速度创纪录,Cursor ARR突破5亿美金 [1][17] - 模型上下文协议MCP加速大模型应用普及,赋能模型获取大量外部信息、操控现有软件应用 [1][19] 模型趋势 - 模型推理能力在思维链范式下通过堆积更多算力持续提升,数理类、代码类问题提升尤其显著,AIME 25竞赛准确率提升7%,Codeforce代码竞赛排名提升239位 [1][22] - 大模型开始走向Agentic,对工具使用进行端到端训练集成,可完成更复杂困难的任务,Humanity's Last Exam榜单表现提升81% [1][23][24] - 大模型开始端到端融合视觉和文本走向多模态推理,以语言为中枢解锁多模态推理 [1][26] - 大模型图像生成能力全方位增强,语言理解能力升级和审美提升是最大亮点,可生成高拟真度的照片和自拍、吉卜力风格图片 [1][28] - 视频生成模型整合原生配音,可控性和编辑灵活度增加,生成视频的物理规律协调性增强,字节Seeddance 1.0模型在视频生成功能中排名第一 [1][29] 技术趋势 - 训练阶段资源投入向后训练和强化学习倾斜,预训练仍有充足优化空间,强化学习算力消耗未来会超过预训练 [2][9] - 多智能体 (Multi-Agent) 系统可能成为下一个前沿范式 [2][9] - 从交互经验中学习有望成为下一代模型学习方式 [2] - Transformer模型架构快速迭代,混合架构涌现 [2] 行业趋势 - xAI发布Grok 4跻身全球大模型第一梯队,证明大模型无护城河 [2][9] - 算力是AI竞赛关键要素,头部玩家计算集群达数十万卡规模 [2] - OpenAI领先优势缩小,谷歌和xAI迎头赶上 [2][9] - 中美通用大模型技术差距缩小,中国模型在多模态等领域表现出色 [2] - AI编程成为必争之地,海内外头部玩家密集布局 [2][17] - 国内大模型创业公司路线分化 [2]
2025上半年AI核心成果及趋势报告