Workflow
Django Web 框架
icon
搜索文档
2025 到底是 LLM 的「什么年」?
机器之心· 2026-01-31 16:06
2025年LLM年度趋势概览 - 行业将2025年称为“AI Agents之年”和“推理之年”,标志着LLM在技术、应用、生态和治理方面取得多项重要进展 [1] - Django Web框架开发者Simon Willison撰文《2025: The year in LLMs》,用27个“The year of XX”主题系统梳理了年度发展趋势与热门话题 [5][8] 以推理与智能体为主线的技术进展 - 2025年LLM推理能力的突破核心在于从“静态问答更聪明”转向“稳定驱动工具链”,能够规划多步行动、调用外部工具并根据反馈持续调整计划,从而完成更长、更完整的任务链条 [9][12] - 行业对“Agent”的定义逐步收敛,并在编码与搜索两大场景中实现高频、规模化落地,相关能力与产品形态持续迭代演进 [9] - 几乎每个主要AI实验室都发布了至少一个推理模型,并出现了可在推理与非推理模式间切换的混合模型,以及通过API调节推理量的“旋钮” [12] - 以o1和DeepSeek-R1等推动的RLVR方法对提升LLM推理能力有显著帮助,并引发了相关研究热潮 [12] 关键应用场景与产品化落地 - 智能体开始能承接更长周期的工程任务,其价值从技术演示走向实际交付,标志着“The year of long tasks” [10] - 编码智能体进入可规模化的“交付形态”,以Claude Code为例,其通过“本地CLI与云端异步交付”的方式降低了工程实现门槛 [10] - 命令行界面从“工具链语言”转变为“自然语言界面”,LLM使不熟悉命令行的开发者能用自然语言生成并执行命令,从而扩大了CLI工具链的可用人群与使用频率 [10] - “AI搜索”和“AI编程”等应用在2025年开始落地 [13] 生态发展、市场竞争与风险关注 - 行业讨论了如“The year of MCP”、“The year of conformance suites”和“The year of top-ranked Chinese open weight models”等年度热词,涉及LLM市场竞争、基础设施发展及生态变化 [11] - 聚焦于YOLO及其“偏差正常化”风险,其通过自动放行提升了智能体的编码效率,但“长期无事故”可能使风险被忽视并不断累积 [10]