Workflow
小宿模型聚合平台
icon
搜索文档
深度|Agent 全球爆发,Agent Infra是否是搭上这趟快车的关键?
Z Potentials· 2025-08-19 23:03
AI Agent 引爆元年 - 京东云开源业内首个"完整产品级"通用多智能体系统JoyAgent-JDGenie,在GAIA基准测试中取得75.15%整体准确率,显著超越同类产品[2] - Flowith发布革命性Agent产品Neo,支持"三无限":无限步骤执行复杂任务、无限上下文支持百万token记忆、无限工具并行调用[2] - KPMG推出Workbench多Agent平台,初期部署50个智能体并计划扩展至近千个,服务于税务/审计/咨询等领域[2] - AI Agent正从单一对话工具向主动执行任务/联动服务/实时反馈的"数字生产力"转型[3] AI Agent落地四大痛点 - 稳定性问题:算力波动/调用延迟/数据获取超时导致执行链路断裂,缺乏高可用云节点和弹性算力调度[4] - 数据质量差:内部文档分散/多版本冗余/缺乏标准化,实时数据更新不及时[5][6] - 模型管理分散:缺乏统一接入平台,版本切换慢/策略路由缺失/推理延迟高[7] - 调试监控困难:跨云跨系统缺乏全链路可观测性,金融/医疗等场景合规部署阻力大[8] Agent Infra关键能力 - 需提供稳健执行环境/高效模型管理/多样工具调用/精准数据供给和安全合规[8] - 小宿科技构建三层Infra:IaaS层提供全球化云服务,MaaS层实现模型聚合管理,DaaS层提供智能搜索与数据服务[12] - 打通"可靠运行环境+可控模型治理+高质量实时数据"的Agent运行逻辑[14] 联网检索+实时数据接入 - AI Agent需实时获取最新政策/新闻/市场动态以支撑决策,LLM知识滞后问题需联网搜索解决[15][17] - RAG技术实现检索增强生成流程,先检索信息再生成专业回答[19] - 企业级Agent需持续获取外部联网数据保持实时性/高效性/准确性,应用于客服/市场分析/金融投资等场景[21][22] 小宿智能搜索优势 - 月调用量达数亿次,服务近千家企业[23] - 支持35+语言和多模态检索,符合GDPR/CCPA等法规[25][26] - 提供长摘要总结和结构化输出,自动高亮关键信息[27] - 在44%查询中优于主流搜索引擎,SLA达99.9%[28][31]