模型路由
搜索文档
清华大学翟季冬:从“算得出”到“送得到”,“智能路由”打开 AI 基础设施新赛道
环球网· 2026-01-30 19:06
AI基础设施(AI Infra)的发展阶段与使命升级 - 人工智能基础设施是支撑AI技术演进与产业落地的核心底座,其发展始终与行业需求同频共振 [1] - 在大模型爆发初期,AI Infra通过高性能算子、优化训练框架、高效推理引擎等关键技术,集中支撑了“智能的生产”,助力大模型迭代升级与规模化推理部署 [1] - 当前,随着大模型生态繁荣、智能体加速涌现,AI正从技术研发迈向“赋能千行百业”的深度融合期,AI Infra的使命也随之升级,需更聚焦“智能的流通”,为AI技术精准触达最终业务场景扫清障碍 [1] “人工智能+”国家战略与行业核心课题 - 中央经济工作会议在重点任务中明确“深化拓展‘人工智能+’”,推动人工智能同产业发展、文化建设、民生保障、社会治理广泛深度融合,全方位赋能千行百业 [3] - 在此背景下,打通大模型从技术研发到产业应用的“最后一公里”,让智能服务精准匹配场景需求,已成为行业亟待破解的核心课题 [3] - 工信部等八部门联合印发的《“人工智能+制造”专项行动实施意见》指出,到2027年,将推动3至5个通用大模型在制造业深度应用,形成特色化、全覆盖的行业大模型,打造100个工业领域高质量数据集,推广500个典型应用场景 [5] AI Infra下一站:从“堆算力”到“修管道”的智能路由 - 行业观点认为,AI Infra的下一站不再是单纯的“堆算力”,而是要着力“修管道”,即通过“智能路由”技术,将合适的模型、优质的服务精准调度至千行百业的各类应用场景 [3] - 智能路由的核心是攻克两大关键挑战:一是“模型路由”,即在差异化大模型中筛选出适配特定任务的最优模型;二是“服务路由”,即在同一模型的多元API服务提供者中,匹配到满足安全、效率、成本等需求的最佳服务 [3] - 实现路径之一,是把“算得出”的智能,通过高效、安全、低成本的“路由器”精准配送到工厂车间、医院诊室等具体场景 [6] 模型路由:实现模型资源的高效调度与成本优化 - 未来通用人工智能(AGI)的格局将是多个AGI和更多的弱AI共同为人类服务,而非单一AGI一统天下 [7] - 模型路由通过智能调度,可将简单任务分配给成本低、速度快的较小模型(如百亿参数模型),将复杂难题分配给能力更强但成本高的大模型(如万亿参数模型),从而实现整体性能与成本的最优平衡 [7] - 举例说明,通过智能调度,整体任务分数仍可保持99分(满分100),但平均成本可下降八成,响应速度提升五倍 [7] - 模型路由将给行业带来巨大的性价比提升空间,是未来一段时期的重要研究课题 [8] 服务路由:解决API服务选择难题并建立评估标准 - 即使是同一个模型,不同供应商提供的API服务在速度、价格、稳定性方面也存在显著差异 [9] - 以中国境内提供deepseek-v3.2模型API服务的数十家厂商为例,其API服务的吞吐量相差10倍(15~200 token/s),支持的输入输出长度相差20倍(8k~160k),服务定价、流量限制、服务稳定性各异 [9] - 用户选择API服务时最关心安全、能力、速度、稳定、价格五个维度,但市场缺乏统一的评估“尺子” [9] - 完善可靠的测试系统是实现高质量服务路由的基础前提 [9] 智能路由为国产算力“换道超车”提供新机遇 - 避免算力卡脖子,把国产算力用起来,已成为中国AI行业的共识 [10] - 大模型API服务具有标准接口,可以规避开发者直接使用国产算力设备面临的生态不兼容问题 [10] - 服务路由可根据用户要求将任务调度至基于国产算力(如海光、昇腾、寒武纪)的服务上,用户无需自行移植适配,即可轻松满足算力国产化需求 [10] - 目前国产算力的硬件指标已足够承载大部分场景的智能服务需求,只需进一步提升部署智能服务的性能,就能在部分条件下取得相比海外算力的性价比优势 [10] - 提升性能的关键在于面向国产算力架构原生设计并深度优化的推理引擎,直接移植海外推理引擎会制约国产算力的发挥空间 [10] - 以清华团队开源的推理引擎“赤兔Chitu”为例,其在国产平台上优势显著,正是因为进行了大量面向国产平台的原生开发与优化 [11] 智能路由的战略意义与未来展望 - 智能路由的探索与实践,不仅是AI Infra技术边界的拓展,更是对“人工智能赋能千行百业”的有力支撑 [12] - 它通过优化模型选择与服务配置,实现了智能服务的高效、廉价、稳定、安全流通,契合国家“降本增效”的发展要求,也为算力国产化、数据要素价值释放提供了可行路径 [12] - 未来,随着智能路由成为AI Infra的标准配置,人工智能服务将更便捷地融入生产生活各领域,为数字中国建设注入强劲动力,推动中国人工智能产业在全球竞争中占据有利地位 [12]