行业趋势:从通用大语言模型转向专业微智能体 - 公司正用更小、更专业的微智能体取代大语言模型,以更快、更准确地处理任务[1] - 早期应用显示,专注于特定任务的智能体在成本、可靠性和速度上优于通用模型[1] - 通用大语言模型作为全能系统进入市场,但存在显著局限性,如需要大量算力、在高负载时期引入延迟,以及在执行行业特定工作时产生不稳定结果[3] - 微智能体专注于单一任务,使用更小的数据集进行训练,操作边界更严格,从而减少输出不一致性、缩短推理时间,并使公司能更清晰地控制性能[4] 微智能体的优势与特性 - 微智能体更易于维护,每个智能体仅处理一项任务,更新无需重新训练整个系统[5] - 当性能出现偏差时,团队可纠正或替换单个智能体,而不会中断其他工作,这种模块化结构允许公司将人工智能集成到更多运营层面,且不会产生全天候运行大模型相关的成本激增[5] - 微智能体更易于调整、部署更快,且在大规模运营时更具可预测性[4] - 各行业企业均已采用微智能体[5] 公司案例:CrowdStrike - CrowdStrike在其安全平台上应用微智能体,开发了用于审查警报、标记异常和推荐修复步骤的智能体[6] - 这些智能体完全基于威胁模式、遥测信号和内部检测工作流程进行训练,而非广泛的对话数据[6] - 公司准确率从约80%提升至98%以上,并将手动分析工作量减少了近90%[6] - 智能体以先前需要多名分析师才能完成的速度处理警报,并通过统一标准评估每个警报提高了处理一致性[6] - 在威胁量激增时,微智能体帮助公司更快响应,用于处理第一层过滤和分类,使分析师能专注于需要深入调查的案件[7] 公司案例:PayPal - PayPal采用基于Nvidia开源模型构建的微智能体,支持欺诈审查、开发者协助和商户支持等一系列内部运营[8] - 公司使用专有的支付和商业数据对智能体进行微调,使其具备通用系统所没有的上下文理解能力[8] - 新架构使多个内部工具的延迟减少了约50%,并提高了开发人员生产力[9] - 由于智能体范围狭窄,PayPal能以更短的周期修订它们,并在无需大量提示调整的情况下部署更新[9] 公司案例:Synopsys - Synopsys在与Nvidia扩大合作后,将基于智能体的工具引入半导体设计领域[10] - 公司将其AgentEngineer技术与Nvidia的NeMo Agent Toolkit和Nemotron开放模型集成,以支持芯片设计流程中的验证、调试和代码分析任务[10] - 早期部署缩短了部分工作流程,使团队能更快发现潜在问题,并减少了跨设计阶段收集数据所花费的时间[10] - 智能体工具通过每次使用相同标准评估设计输入来提高一致性,运行检查并准备结构化输出供团队评审[11] - 芯片设计过程涉及数千个步骤,能从自动化可重复操作的工具中受益[11]
PayPal, CrowdStrike and Synopsys Use Focused AI for Speed, Accuracy