小模型才是 Agent 系统的「核心组件」?
机器之心·2026-04-19 09:30

小模型如何从「先看能不能跑」转向「先看适不适合」? - 2020年至2024年,大语言模型能力提升伴随计算、内存和部署成本上升,资源受限的移动与边缘设备部署压力增加,小模型因此在端侧和边缘场景获得持续采用,其研究动因被明确指向资源受限条件下的部署需求[1-3] - 2024年的研究综述指出,端侧部署的核心矛盾在于大语言模型计算开销高与移动设备、边缘硬件资源约束强之间的矛盾,小模型的重要性与其能以较低资源开销在本地完成推理直接相关[1-4][1-5][1-6] - 2025年以后,随着小模型能力提升,其在部分通用任务上开始具备明确的任务可用性,系统对小模型的判断标准从部署可行性转向任务适配性和环节分工,例如先进小模型在部分任务上的结果已超过某些7B级模型[1-7] - 判断标准变化后,模型分配进入系统设计,小模型角色从“资源约束下的可运行组件”转向“按任务能力配置的执行单元”,选择依据从可运行性转向任务链路适配性,例如在GPT-5.4使用指南中,nano模型用于分类、抽取等高频结构化任务,mini模型用于子任务和工具使用[1-8][1-9][1-10] 小模型为什么更容易在 Agent 系统中「定岗」? - 小模型开始稳定承担具体任务后,系统设计焦点从“能不能用小模型”转变为“哪些环节该交给小模型”,模型分配进入链路设计,小模型由资源受限场景中的可运行组件转向工作流中的执行单元[5] Agent 系统的模型选择逻辑在如何变化? - 随着小模型能力提升,模型在系统中的使用方式发生变化,从资源受限条件下的可运行选择转为按任务能力配置的执行单元,这一转向推动Agent系统拆分工作流并重新分配模型位置[1] - 模型选择逻辑由单一模型选择转向面向整体流程的编排,当任务链路被拆开后,模型选择从单次取舍走向整体编排[2]

小模型才是 Agent 系统的「核心组件」? - Reportify