小模型才是 Agent 系统的「核心组件」？

小模型如何从「先看能不能跑」转向「先看适不适合」？ - 2020年至2024年，大语言模型能力提升伴随计算、内存和部署成本上升，资源受限的移动与边缘设备部署压力增加，小模型因此在端侧和边缘场景获得持续采用，其研究动因被明确指向资源受限条件下的部署需求[1-3] - 2024年的研究综述指出，端侧部署的核心矛盾在于大语言模型计算开销高与移动设备、边缘硬件资源约束强之间的矛盾，小模型的重要性与其能以较低资源开销在本地完成推理直接相关[1-4][1-5][1-6] - 2025年以后，随着小模型能力提升，其在部分通用任务上开始具备明确的任务可用性，系统对小模型的判断标准从部署可行性转向任务适配性和环节分工，例如先进小模型在部分任务上的结果已超过某些7B级模型[1-7] - 判断标准变化后，模型分配进入系统设计，小模型角色从“资源约束下的可运行组件”转向“按任务能力配置的执行单元”，选择依据从可运行性转向任务链路适配性，例如在GPT-5.4使用指南中，nano模型用于分类、抽取等高频结构化任务，mini模型用于子任务和工具使用[1-8][1-9][1-10] 小模型为什么更容易在 Agent 系统中「定岗」？ - 小模型开始稳定承担具体任务后，系统设计焦点从“能不能用小模型”转变为“哪些环节该交给小模型”，模型分配进入链路设计，小模型由资源受限场景中的可运行组件转向工作流中的执行单元[5] Agent 系统的模型选择逻辑在如何变化？ - 随着小模型能力提升，模型在系统中的使用方式发生变化，从资源受限条件下的可运行选择转为按任务能力配置的执行单元，这一转向推动Agent系统拆分工作流并重新分配模型位置[1] - 模型选择逻辑由单一模型选择转向面向整体流程的编排，当任务链路被拆开后，模型选择从单次取舍走向整体编排[2]