Data in AI
搜索文档
Tech Giants Split on How to Scale Agentic AI
PYMNTS.com· 2026-02-23 17:00
文章核心观点 - 构建和运行智能体AI面临的根本挑战在于数据 数据是AI的基础 没有数据就没有智能体[1] - 企业构建智能体AI的实践瓶颈在于数据分散且难以被有效理解和利用 而非模型本身[2] - 行业正通过技术合作、系统化评估和自动化数据管道等多种方案来解决数据准备、治理和评估的“最后一英里”问题[3][4][11] 谷歌与Ab Initio的合作伙伴关系 - 谷歌指出企业团队构建智能体AI遇到的实际限制是 数据通常分散在云平台、本地系统和旧式大型机中 导致AI智能体只能基于其能触及和理解的数据水平来行动[2] - 谷歌与Ab Initio合作 旨在结合谷歌数据云组件与Ab Initio的“中立枢纽” 连接数百个数据源并在混合多云环境中标准化元数据[3] - 该方案保持数据分布式存储 同时统一元数据 并添加详细的沿袭追踪和治理功能 目标是为Gemini等模型提供更丰富的上下文 使智能体推理更准确 操作更透明可控[3] AWS对智能体的管理与评估方法 - AWS认为构建AI智能体最困难的部分不是让模型“说话” 而是证明系统在需要执行多步骤、使用工具和从记忆中提取信息时能可靠工作[4] - 传统AI测试通常只关注最终答案 这会掩盖智能体失败的真实原因 因此需要将智能体视为完整系统进行评估 并度量其过程中的每一步[4] - 强有力的评估始于良好的输入 特别是记录智能体每一步实际操作的追踪文件 以及用于回归测试的包含真实答案的“黄金”数据集[8] - 评估指标涵盖最终响应质量、任务成功率、工具使用准确性和记忆质量 团队使用历史日志和模拟交互构建数据集 以比较智能体行为与已知结果 从而在部署前后定位故障并提高可靠性[9] 企业智能体AI的“最后一英里”数据问题与解决方案 - 许多企业智能体AI项目卡在“最后一英里”数据问题上 即企业能为仪表板准备干净稳定的数据 但智能体需要用于实时决策的混乱、不断变化的运营数据[11] - 最大的失败常发生在不完美的数据到达真实用户时 而非模型生成文本时[11] - 供应商Empromptu提出“黄金管道”作为解决方案 将其视为AI应用本身的一部分 它是一个位于原始运营数据和AI功能之间的自动化层[11][12] - “黄金管道”从多个来源摄取数据 进行清理和结构化 通过标注和丰富填补空白 并应用审计追踪和访问规则等治理控制 其内置评估循环能将每次数据转换与下游智能体性能关联 从而检测数据清理步骤是否导致智能体准确性下降[12] - 活动平台VOW作为客户案例 使用该方法将不一致的平面图和票务数据转化为AI驱动功能可用的输入[13]