AI Observability
搜索文档
Notion、Stripe 都在用的 Agent 监控,Braintrust 会是 AI-native 的 Datadog 吗?
海外独角兽· 2025-09-25 18:33
文章核心观点 - AI Agent从演示走向产品化,开发者面临的核心挑战从模型本身转向如何观测、评估和优化这些黑箱系统[2] - Braintrust公司正将可观测性从传统的"监控指标与日志"重塑为"模型评估与行为追踪",以满足AI时代的新需求[2] - 系统性评估和可观测性将重新定义AI开发领域,并成为AI开发的默认配置,正如CI/CD成为软件开发的默认配置一样[4] - Braintrust凭借其产品力与高执行力,有望成为Agent时代的"新Datadog"[3][4] 产品功能 - Braintrust提供Eval(实验评估)和Ship(线上监控)两大核心模块,让团队能在实验阶段大规模测试不同模型与提示词的组合,并在生产环境持续跟踪模型表现[2][8] - Eval功能聚焦LLM的详细评估,通过多样化的Score方式(包括内置评测规则和自定义规则)帮助开发者衡量AI应用的准确性、一致性和安全性[9][10] - Ship功能实现LLM规模化部署监控,通过抽样实时生产环境中的数据流,跟踪成本、延迟和输出性能表现,并支持安全告警[13] - 2025年下半年推出的Loop AI Workflow是新功能,可将Eval和Ship自动化,帮助生成评估标准、测试数据集和prompt[24][25] - 产品采用Log-Trace-Span层级结构记录AI行为,Trace记录单个请求或交互,Span对应LLM执行中的工作单元[14][19] 市场背景与需求 - LLM市场预计到2030年达到361亿美元,AI平台市场到2030年达到943亿美元,将带动配套评估/观测工具渗透[5] - RAG、Agent、Copilot等技术带来的链路复杂度暴涨,以及合规/风险要求倒逼可追溯性需求[5] - 公司对大模型成本敏感,需要Trace功能来了解大模型的成本使用情况[5] - 传统Observability市场的四大支柱(指标、日志、追踪、性能分析)在AI时代需要扩展以适应LLM的不确定行为方式[4][5] 客群及商业化 - Braintrust拥有约3000家客户,每日进行超过3000次AI Eval评估,顶尖AI团队使用时间达到每天两小时以上[8][33] - 客户主要是将AI深度嵌入核心产品流程的科技公司,如Notion、Zapier、Stripe等头部公司[2][31] - 商业化采用Product-led Growth模式,通过self-service product吸引用户体验后获得自然流量[35] - 付费模式分为免费和PRO(249美元每月)两档,定价核心是以结果评估Score为中心进行阶梯式收费[36] - 估算显示中型用户每年可带来约456万美元收入,而类似GPT的大型用户可带来约5400万美元年收入[38] 团队及融资 - 创始人Ankur Goyal于2023年创立Braintrust,具有连续创业背景(曾创立Impira并被Figma收购)[42][44] - 公司先后完成两轮融资:2023年12月完成510万美元种子轮,2024年10月完成3600万美元A轮融资,投资方包括a16z、Greylock等[45] - 团队规模约11-50人,估值约1.5亿美元,保持每周2-6个更新的产品迭代节奏[42][50] - 团队以高执行力和快速响应客户需求著称,如在一天内完成Gemini AI接入的产品上线[46] 市场竞争 - AI Observability赛道在2024-2025年有多家公司获得融资,典型客户集中在AI Native或AI加速的SaaS公司[53] - 主要竞争对手包括LangSmith(每月3万注册量级)、Datadog、Arize AI、Patronus等[8][54] - Braintrust在LLM eval上具有明显功能优势,评估体系Scorer极其丰富且更精细化,而Datadog更偏向告警和运维管理[59][60] - Braintrust采用request-level tracing架构,一级对象包括evaluation run、prompt-response pair等,更贴近模型能力观测[77] - 产品UX交互体验优秀,SDK设计良好,数据流统一,是胜过其他竞品的重要原因[67][68]
Dynatrace (NYSE:DT) 2025 Conference Transcript
2025-09-11 02:12
公司及行业 * 公司为Dynatrace (NYSE:DT) 一家提供可观测性平台的软件公司[1][3][17] * 行业为IT可观测性市场 涵盖应用性能监控(APM) 基础设施监控 日志管理等领域[17][20][23] 核心财务与业务表现 * 年度经常性收入(ARR)从四年前不足10亿美元增长至接近20亿美元[8] * 上一季度订阅收入增长19% 税前自由现金流增长33% 运营符合"Rule of 50"[18][19] * 日志消费业务年同比增长超过100% 季度环比增长36%[34] * Dynatrace平台订阅(DPS)已贡献65%的ARR 其客户的消费增长速度是非DPS客户的两倍[52][53][54] 市场机遇与竞争定位 * 可观测性市场非常强劲 受云化和AI工作负载驱动 需求在增加而非减少[17] * 公司在Gartner魔力象限等报告中均处于领导者象限[21] * 核心机遇在于三个维度的演进:端到端可观测性 AI可观测性 业务可观测性[22][24][25] * 端到端可观测性可带来20%或30%的成本削减[24] * 当前市场整合仍处于早期阶段 比喻为"第三局早期"[27] 产品与技术优势 * Grail数据湖屋是技术突破 能将日志 追踪 指标等所有可观测数据类型集成在统一的上下文中[23][35] * 基于Grail的统一数据存储和AI引擎能提供更优的洞察和结果 这是与竞争对手的关键差异[23][32][35] * 在定价模式上创新 如提供包含查询次数的模型 消除了客户对使用量激增的担忧[37] * 其架构不区分冷热存储 能始终提供高性能的日志访问[38] 销售与渠道策略 * 在上一财年下半年扩充了销售团队 约三分之一的销售人员仍在入职第一年 预计其生产力将在本财年下半年显现[39][40] * 销售策略聚焦于大型企业 因为其数据量 规模和复杂性最能体现公司产品的差异化优势[46] * 上一季度完成了12笔七位数ACV的交易 大额交易导致业绩波动性增加[47] * 与全球系统集成商(GSI)和超大规模云厂商的合作渠道管线表现强劲 超出预期两到三倍[43][44] 增长驱动因素 * 四大增长驱动力:日志机遇 消费增长机遇 管线数字 DPS[56] * 消费增长是未来机会的重要先行指标 其增速超过ARR和订阅收入增速(19%) 预计在20%以上[55] * 已组建专门团队 并将客户成功团队等的薪酬与消费增长挂钩 以全力推动消费[57][58] 人工智能(AI)战略 * AI可观测性包含两方面:观察AI工作负载 以及提供自主的AI可观测性平台[66][67] * 已有数百现有客户使用Dynatrace观察AI工作负载[66] * 长期愿景是打造真正的自主AI可观测性平台 能在终端用户发现问题前就采取纠正措施[67][69] * 竞争优势在于其集成平台能提供可信的答案和因果关系 而非简单的关联 这是实现自主操作的基础[68] 潜在风险与挑战 * 大额交易导致季度业绩波动性增加[47] * 在提供指导时因这种波动性而趋于保守[47] * 部分超大企业客户在DPS合同期末可能选择按实际消费支付尾款 而非立即续约扩大承诺 这带来了收入确认上的细微差别[61][63]