Datadog MCP Server
搜索文档
Datadog Launches MCP Server to Provide AI Agents with Secure, Real-Time Access to Unified Observability Data
Globenewswire· 2026-03-09 21:00
公司产品发布 - Datadog公司于2026年3月9日宣布其MCP Server产品已全面上市[1] - MCP Server是一个为智能体系统专门构建的接口,旨在将Datadog的统一可观测性平台直接扩展到AI工作流中[3] - 该产品为将AI智能体嵌入开发和运维工作流的开发者提供对实时可观测数据的访问[1] 产品核心功能与价值主张 - 使工程团队能够在不切换上下文的情况下快速调试和采取行动:在调查生产问题时,将实时日志、指标和追踪数据直接输入Claude Code、Cursor、Codex、Github Copilot、Cognition和Visual Studio Code等AI编码智能体[7] - 赋予定制AI智能体直接访问实时可观测性和情报的能力:使智能体能够利用Datadog的主动检测和修复信号,从而自动调查和响应问题[7] - 简化AI工作流的数据访问:通过为智能体通信提供一个动态、专门构建的协议,降低破坏性变更的风险[7] - 帮助工程团队在既定的安全和治理控制范围内采取行动[1] - 通过将来自Datadog统一可观测性平台的遥测数据集成到团队AI工作流中,推动AI原生开发进入新阶段,即从简单的AI副驾驶发展到AI在实时生产系统上运行[2] 市场背景与客户需求 - 将AI智能体嵌入工作流正成为各行业公司的标准实践[2] - 工程团队面临的任务是使AI智能体投入运营,并应对这一过程中极高的复杂性[2] - 客户需要安全、受管控的生产数据访问权限,降低集成开销,并满足合规要求[2] - AI加剧了复杂性,尤其是其创新速度,而MCP Server等产品的发布旨在帮助客户解决这种复杂性[3] 公司战略与定位 - Datadog是面向云应用的领先AI驱动可观测性和安全平台[5] - 其SaaS平台整合并自动化了基础设施监控、应用性能监控、日志管理、用户体验监控、云安全等多项功能,为客户整个技术栈提供统一、实时的可观测性和安全性[5] - 公司致力于提供将复杂性转化为清晰度、将盲点转化为安全性的AI解决方案,以保护全球企业并使运营无缝化[2] - 该产品旨在帮助团队更高效地使用Datadog在其组织内构建和扩展AI系统[2] - 该产品旨在实现开发、运维和安全团队之间的自主协作,使他们不仅能在Datadog内检测、决策和处理问题,还能在整个开发过程中构建、交付和评估软件[3]
Datadog (NasdaqGS:DDOG) 2026 Investor Day Transcript
2026-02-13 03:02
Datadog 2026年投资者日纪要分析 涉及的行业与公司 * 公司:Datadog (NasdaqGS:DDOG),一家提供云监控与安全服务的SaaS平台公司[1] * 行业:云计算、可观测性、IT运维、安全、人工智能应用开发与运维[4][5][6] 核心观点与论据 市场机遇与公司定位 * 云迁移与数字化转型持续进行,Gartner预计到2027年公共云支出将超过1万亿美元,但仍仅占全球科技支出的16%[5] * AI时代进一步加剧了客户面临的系统复杂性,因为AI允许事物被更快地构建,且AI代理开始自主行动,风险更高[11] * Datadog致力于解决客户面临的巨大复杂性难题,连接其所有软件组件,并随着其部署的基础设施计算单元、创建和交付的服务而扩展[11] * 公司定位在代码与生产环境交汇处,随着AI编码可能带来数量级的开发加速,解决此处的复杂性将变得更加重要和普遍[24] * 公司的长期愿景是实现开发、运维和安全领域的自主性,从可观测性迈向自主性的边缘[25] 平台扩展与产品战略 * 平台已从核心的可观测性扩展到数据层、数字体验、开发者工具、安全和云服务管理等多个类别[13][14][15][16][17] * 作为平台价值的证明,公司在基础设施监控领域拥有16亿美元的年度经常性收入,在日志管理以及端到端APM和DEM套件领域各自拥有超过10亿美元的年度经常性收入[18] * 公司在可观测性的三大支柱(基础设施、日志、APM)上实现了真正的平衡与规模,这在行业内是独特的[19] * 平台规模巨大,拥有超过30,000家客户,25款产品,能够处理每小时数万亿的事件[49] * 公司通过“自带云”解决方案满足有数据驻留、合规性或极高数据量需求的客户,这有望解锁更多市场机会[57][58] AI战略:AI for Datadog 与 Datadog for AI * **AI for Datadog**:将AI嵌入整个Datadog平台,使各类工程师能更快地工作。AI代理能比人类更快地呈现上下文、识别问题并推荐修复方案[19][20] * **Datadog for AI**:为客户的AI应用或代理提供可观测性。如果客户将LLM或代理投入生产应用,这些系统需要像其他关键应用一样被监控[20] * 公司拥有独特的数据优势:每天摄取数万亿数据点、数十亿条追踪记录、艾字节级的日志,且数据具有多样性[28] * 公司训练自己的小型专用模型(如时间序列模型Toto),与前沿大模型相比,在可观测性和安全领域能以低得多的成本实现更好的准确性[32][40] * 通过Bits AI代理(如SRE代理、安全分析代理、开发代理)推动自动化调查、修复和代码生成,目标是实现自主运维[33][91][97][99] * Bits AI SRE代理自发布以来,客户已运行超过10万次调查;仅在2024年1月,就有超过2,000名客户使用Bits AI进行调查[97] 安全业务进展 * 安全产品组合旨在打破传统上反应性安全与主动“左移”安全之间的孤岛[61] * 产品包括云SIEM、云安全态势管理、AI与数据安全、代码安全等[62] * 目前已有超过8,500家客户使用Datadog的安全产品,其中包括四分之一的财富500强公司,安全业务年度经常性收入已超过1亿美元[63] * 在百万美元级客户中,70%使用一款或多款Datadog安全产品,但安全支出仅占其Datadog总支出的2%,显示出巨大的钱包份额增长潜力[64] 研发投入与竞争优势 * 公司持续将约30%的收入投入研发,2025年研发投资超过10亿美元,年底拥有约4,000名工程师[12] * 公司认为其研发投入是最大同行公司的数倍[12] * 竞争优势源于:1) 对大量清洁、丰富数据的持续访问;2) 自建模型;3) 数据的多样性;4) 深厚的领域专业知识[38] * 平台本身是关键差异化因素,使公司能够快速创新、保持精简,并全面支持客户用例及其技术栈[57] 其他重要内容 客户案例与价值体现 * 一家美国大型保险公司在使用Datadog核心产品后,严重事件数量减少了10倍,每年节省约70人年的工作量,相当于1,100万美元,客户影响降低了20倍[90] * 一家全球性银行拥有5,000名工程师和1,500个应用,通过将一切整合到Datadog,实现了全球性影响,每天避免数百万美元的损失,并释放了高价值工程师的时间[68][69][70][71] * 一家快速发展的AI公司在一年内采用了16款Datadog产品,这对他们的业务成功至关重要[50] * 多家客户(如华盛顿邮报、Wawa、Mercado Libre、Porsche Informatik等)在视频证词中强调了Datadog在提供可见性、快速解决问题、降低成本、改善客户体验方面的关键作用[179][181][188][196][202] 财务与市场指标 * 公司整体年度经常性收入超过1亿美元的产品线包括:基础设施监控(16亿美元)、日志管理(>10亿美元)、APM+DEM套件(>10亿美元)[18] * 安全产品年度经常性收入已超过1亿美元[63] * Flex Logs产品年度经常性收入接近1亿美元,且增长迅速[52] * 云SIEM业务在5年内增长了18倍,且增长仍在加速[53] * 公司整体市场份额仍仅为中等十几百分比,增长空间巨大[26] 竞争与生态系统 * 公司对OpenTelemetry持开放和贡献态度,认为数据收集不是其差异化的核心,核心在于对数据的理解、处理与关联能力[174][176][177] * 在安全领域,公司认为其统一平台带来的优势是差异化关键,并看到现有市场中有很大的增长空间[123] * 对于AI编码助手(如Claude、GPT)的兴起,公司认为这是互补而非替代关系,Datadog的独特价值在于提供生产环境的实时上下文[149][150][155][156] 未来方向 * 公司认为实现自主运维是一个渐进的过程,需要技术演进与客户信任、文化演进相结合[136] * 已识别出需要加快发展的关键领域,包括功能标志与实验、数据可观测性等[133][134] * 随着AI编码的普及,软件交付的瓶颈将从编码转向评估变更和交付业务价值的能力,这正是Datadog发挥作用的地方[23][76]
Datadog(DDOG) - 2025 Q4 - Earnings Call Transcript
2026-02-10 22:00
财务数据和关键指标变化 - 第四季度营收为9.53亿美元,同比增长29%,环比增长8%,高于指引区间上限 [5] - 第四季度账单金额为12.1亿美元,同比增长34% [28] - 剩余履约义务(RPO)为34.6亿美元,同比增长52% [28] - 第四季度自由现金流为2.91亿美元,自由现金流利润率为31% [5][31] - 第四季度非GAAP营业利润为2.3亿美元,营业利润率为24% [30] - 第四季度非GAAP毛利润为7.76亿美元,毛利率为81.4% [28] - 客户总数约32,700家,去年同期约30,000家 [5] - 年度经常性收入超过10万美元的客户约4,310家,去年同期约3,610家,这些客户贡献了约90%的ARR [6] - 过去12个月净收入留存率约为120%,过去12个月总收入留存率稳定在95%以上 [27] - 2026年第一季度营收指引为9.51亿至9.61亿美元,同比增长25%-26% [31] - 2026年全年营收指引为40.6亿至41.0亿美元,同比增长18%-20% [32] - 全年指引中假设剔除最大客户后的核心业务增长至少20% [32] 各条业务线数据和关键指标变化 - 三大核心可观测性支柱均表现强劲:基础设施监控ARR超过16亿美元,日志管理ARR超过10亿美元,APM和DEM产品套件ARR超过10亿美元 [9] - 核心APM产品同比增长加速至30%以上,是当前增长最快的核心支柱 [9] - 平台产品采用率持续提升:84%的客户使用2个或以上产品,55%使用4个或以上,33%使用6个或以上,18%使用8个或以上,9%使用10个或以上 [6][7] - AI相关产品增长显著:超过1,000名客户使用AI可观测性产品,过去六个月品牌数量增长10倍 [12] - 约5,500名客户使用一个或多个Datadog AI集成来发送其机器学习、AI和LLM使用数据 [13] - 日志管理产品在整合方面取得成功,2025年通过近100笔交易取代大型传统供应商,带来数千万美元新收入 [13] - 安全产品(Cloud SIEM)在大型企业中积极取代现有市场领先解决方案 [15] - 2025年发布了超过400项新功能和能力 [10] 各个市场数据和关键指标变化 - 截至2025年12月,48%的财富500强公司是Datadog客户 [7] - 财富500强客户的中位ARR仍低于50万美元,表明增长空间巨大 [8] - AI原生客户群约650家,其中19家客户年支出超过100万美元 [27] - 前20大AI原生公司中有14家是Datadog客户 [27] - 第四季度新客户预订量非常强劲,平均新客户初始交易规模持续强劲增长 [27] - 第四季度签署了18笔总合同价值超过1000万美元的交易,其中两笔超过1亿美元,还包括一笔与领先AI模型公司的八位数新客户交易 [5] 公司战略和发展方向和行业竞争 - 公司战略围绕两大方向:为Datadog平台融入AI以提升客户价值,以及构建产品以观察、保护和管理客户的AI技术栈 [24] - 平台战略持续获得市场认可,致力于为客户解决从软件开发、生产、数据栈、用户体验到安全的全方位问题 [24] - 在AI领域,公司将AI工作分为两类:用于增强Datadog平台的“AI for Datadog”(如Bits AI SRE Agent、Bits AI Dev Agent、Bits AI Security Agent)以及用于观察和保障客户AI技术栈的“Datadog for AI”(如LLM可观测性) [10][11][12] - 公司认为数字化转型和云迁移是其业务的长期结构性增长驱动力 [24] - 竞争格局未发生重大变化,公司持续从有规模的竞争对手那里夺取市场份额 [69] - 公司认为在可观测性领域竞争需要持续创新,并对自身的方法和未来计划充满信心 [70] - 公司认为没有理由将LLM的可观测性与系统的其他部分分开,因为LLM并非孤立工作,需要与整个生产环境集成 [71] 管理层对经营环境和未来前景的评论 - 需求环境呈现广泛的积极趋势,云迁移持续保持势头 [4] - 收入增长加速,这主要由非AI原生客户的广泛基础业务拐点所驱动 [4] - AI原生客户群继续保持非常高的增长,这些客户正进入生产阶段并增长用户、令牌和新产品 [4] - 客户流失率保持低位,增长收入留存率稳定在95%以上,突显了平台对客户的关键性 [5] - 2026年,公司开始看到客户将AI使用融入其应用的拐点,以及客户开始采用如Bits AI SRE Agent等AI创新 [25] - 管理层对2026年的计划感到更加兴奋 [25] - 对于长期前景,公司整体观点不变,即数字化转型和云迁移是业务的长期增长驱动力 [24] 其他重要信息 - 第四季度预订额创纪录,达到16.3亿美元,同比增长37% [5] - 公司举办了投资者日,计划分享更多关于服务客户、平台创新和通过AI提供更大价值的细节 [25] - 2025年,公司达到了超过1,000个集成的里程碑,使客户能够轻松引入各类数据并与最新技术互动 [13] - 发布了多项新产品和功能,包括Data Observability、Storage Management、Kubernetes自动扩缩容、路径分析、RUM without limits、Code Security、Security Graph、Feature Flags、内部开发者门户、OnCall等 [14][16][17] - 本季度完成了多笔重要交易,涉及AI金融模型公司、欧洲数据公司、领先电商和数字支付平台、财富500强食品饮料零售商、领先医疗科技公司、拉美主要金融服务公司以及领先金融科技公司,这些交易体现了平台整合价值和客户对多产品采用 [18][19][20][21][22][23] - MCP服务器使用量呈现爆炸式增长,第四季度工具调用次数较第三季度增长11倍 [11] 问答环节所有的提问和回答 问题: 在智能体框架和部署兴起的背景下,对可观测性类别的发展方向、防御性以及客户使用这些工具构建内部解决方案的可能性的最新看法 [36] - 回答: AI将导致应用数量大幅增加,开发速度加快,从而带来更多复杂性。可观测性的价值从编写代码转移到验证、测试、确保生产环境安全及业务对齐,因此需求将增加。智能体和应用内部发生更多事情,人类的工作越来越像可观测性,这将把可观测性带入更广泛的领域。可观测性及其在代码、应用、真实生产环境、用户和业务之间的关联性是AI开发生命周期中最重要的一环 [37][38][39][40] 问题: 在人类SRE和智能体SRE混合程度更高的世界中,可观测性的UI或工作流程是否需要演变,Datadog如何适应 [41] - 回答: 演变是必然的,将看到更多自动化。一切都在加速:更多数据、交互、系统、发布、故障和修复。最终,人类仍将通过某种UI进行交互,许多交互将由智能体自动化。公司正在构建产品以满足这两种情况:为人类提供UI,并通过MCP服务器等将功能直接暴露给智能体。部分功能由公司自身的智能体直接实现,部分通过UI交付给人类 [41][42] 问题: 与AI模型公司的八位数交易的驱动因素,以及市场关于“可以廉价完成”的讨论 [45] - 回答: 情况与赢得任何其他客户类似。客户通常已有内部工具或开源方案,但自行构建通常并不更便宜,因为工程师成本高昂且开发速度是关键制约因素。Datadog可以快速展示价值。在AI客户群中,这并不独特,该群体都是快速增长、塑造AI世界的公司,它们出于相同逻辑采用Datadog产品 [46][47][48] 问题: 如何考虑LLM长期能做什么与Datadog在可观测性领域经验的界限,以及LLM作为异常检测工具可能对可观测性类别构成的竞争 [51] - 回答: LLM在处理海量数据方面会越来越好。公司的护城河在于两个方面:一是如何整合上下文以输入给智能引擎(如通过MCP服务器),二是未来需要更主动的、嵌入数据平面的实时分析和解决能力,以防止故障发生,而不仅仅是事后分析。这需要处理比通常输入LLM的数据量大几个数量级、更实时的数据流,是不同的问题 [52][53][54][57] 问题: 当客户因更多AI使用导致Datadog账单上升时,如何确保客户仍感到获得巨大价值 [58] - 回答: 软件购买的原则是让客户赚钱或省钱。每当客户购买新产品,公司必须证明其能节省成本或带来新客户。当客户在Datadog平台上增加产品,而不是引入其他供应商,他们通常花费更少 [59] 问题: 2026年指引中的保守程度、对最大客户的假设,以及AI客户群中是否出现集中度风险 [62] - 回答: 指引制定方法保持不变,基于近期趋势并施加保守性。全年指引18%-20%的增长中,假设剔除最大客户后的核心业务增长至少20%,这意味着指引中核心业务的增长率高于最大客户。对于最大客户,由于其消费模式,公司采取了非常保守的假设。AI客户群约650家,相当分散,与整体客户群类似,没有异常的集中度风险 [63][64] 问题: AI客户群收入占比 [65] - 回答: 未提供该数据 [65] 问题: 竞争格局以及LLM兴起如何影响份额变化 [68] - 回答: 市场竞争未发生特别变化,公司持续从有规模的对手那里夺取份额。近期一些并购涉及的公司并非市场上的赢家,未改变竞争动态。LLM兴起带来了新功能和新的服务客户方式,但LLM可观测性市场仍处于早期,产品差异化不大。公司认为LLM可观测性不应与系统其他部分分离,因为LLM需要通过工具与现有或新应用交互,需要生产环境集成,公司在这方面处于有利地位 [69][70][71] 问题: 如何看待大型云服务商巨额资本支出中训练与推理的比例,以及这是否会为Datadog的LLM可观测性收入带来可预测的增长 [74] - 回答: 将其仅与LLM可观测性挂钩可能过于简单化。这预示着未来将有更多应用、更多智能、更多一切。很难直接将云服务商的资本支出映射到未来两三年用于交付价值的基础设施部分。但这无疑预示着系统复杂性、数量和覆盖范围将大幅增加,这对公司业务将大有裨益 [75][76] 问题: 在AI模型公司中是否存在机会分散客户集中度,以及是否看到更多大型AI提供商成为客户 [77] - 回答: 公司的业务模式并非建立在依赖少数客户之上。对于AI领域的所有客户,不使用Datadog产品是不合理的。公司已在该领域取得一些巨大成功,并且有更多客户正在接洽,包括超大规模AI实验室,预计未来将推动更多业务。公司正在向许多最大的参与者销售,这使得该客户群规模更大、更多元化 [78][79][80] 问题: 2026年毛利率预期,以及内部更多使用AI是否会带来运营费用协同效应 [83] - 回答: 毛利率目标仍在±80%左右。公司会在看到效率机会时进行优化,同时平衡对平台的投资。目前内部运营中已在运用AI,初步迹象显示其提高了生产力和采用率,公司将继续评估其对成本结构的影响。短期内,公司预计将继续大力投资研发,AI帮助公司更快地构建更多产品,解决客户更多问题 [85][86] 问题: 对客户希望内部自建可观测性这一“文化选择”的看法在过去一年是否有变化 [89] - 回答: 没有变化。这种情况时有发生,但属于少数。一般趋势是客户从自建开始,然后迁移到Datadog产品并随之扩展。他们越来越多地依赖公司解决问题并交付成果。从经济或专注度角度看,对绝大多数公司而言自建并不合理。即使是拥有所有工具、资金和技术的超大规模公司内部团队,有时仍选择使用Datadog产品,因为它能更直接地解决问题 [90][91] 问题: 市场团队的生产力曲线现状,以及未来12-18个月的投资重点 [95] - 回答: 对生产力感到满意。未来的主要驱动力仍然是扩大规模,市场团队尚未在全球每个市场和细分领域达到所需规模,因此将继续扩张。当前重点是在保持生产力的同时扩大规模。当然仍有许多可以改进的地方,但总体感觉良好,预计未来一年将继续扩大市场团队规模 [96][97] 问题: 核心APM产品增长加速至30%以上的驱动因素,是来自AI原生公司还是核心企业客户 [100] - 回答: APM增长一直较为稳定,因为其部署更深、需要更长时间。增长加速得益于多项措施:大幅简化了部署和上线流程;在数字体验方面进行了差异化投资,推动了更广泛的APM套件采用;加强了市场覆盖,获得了更多交易机会。公司在该市场仍只占很小份额,还有很大增长空间 [101][102][103] 问题: 大型AI原生客户是否显著稀释毛利率,以及2026年初步毛利率指引在多大程度上反映了这类客户的影响与增量投资 [104] - 回答: 按加权平均计算,并未稀释。毛利率与客户规模相关,而非是否AI原生。公司客户基础高度差异化且多元化,预计未来的折扣结构将与客户规模一致。毛利率方面的持续投资包括数据中心和平台开发,因此情况与过去几年类似,并未受AI原生与否的显著影响 [105] 问题: 围绕Bits AI的机遇如何形成,公司如何获取其为SRE和运营团队带来的生产力价值,以及如何看待该领域的竞争 [112] - 回答: 当前通过展示节省的时间来销售价值。与长时间故障、多人参与相比,快速诊断和修复能显著降低成本、缩短客户影响时间。长期来看,现状是事后分析解决故障,未来系统将能够提前发现问题、自动诊断、预先缓解。这需要在数据流中进行实时分析,处理比当前LLM分析多几个数量级的数据,并实时做出判断。这是公司的优势所在,也是通用AI平台难以竞争的领域 [114][115][116][117][118] 问题: 关于营业利润率框架的思考,如何平衡增长与利润 [121] - 回答: 框架是公司在制定计划时采用更保守的收入假设,因为如果收入超过目标,短期内难以进行增量投资。因此,公司优先投资于收入增长,在看到超额完成目标时再增加投资。这反映了公司在平台、研发(包括AI)以及市场方面的持续投资。过去几年,公司在超出预期后,部分超额收益会体现在利润率上,然后为下一阶段增长重新投入 [122][123] 问题: 今年是否需要针对AI客户群进行重大的市场策略调整或投资 [124] - 回答: 公司将继续当前策略,即与客户合作证明长期价值,这体现在客户管理和客户成功团队中。今年的重点是能力增长,包括地域扩张、深化与客户的互动方式、拓展渠道,与往年非常相似 [125]
Datadog Announces Third Quarter 2025 Financial Results
Globenewswire· 2025-11-06 20:00
核心财务表现 - 第三季度收入同比增长28%至8.86亿美元 [1] - 第三季度GAAP营业亏损为600万美元,营业利润率为-1%;非GAAP营业利润为2.07亿美元,营业利润率为23% [6] - 第三季度GAAP摊薄后每股收益为0.10美元;非GAAP摊薄后每股收益为0.55美元 [6] - 第三季度经营活动现金流为2.51亿美元,自由现金流为2.14亿美元 [3][6] - 截至2025年9月30日,现金、现金等价物及有价证券总额为41亿美元 [6] 客户增长与业务里程碑 - 年经常性收入10万美元以上的大客户数量约4,060家,较去年同期的约3,490家增长16% [2][6] - Datadog统一平台上的集成数量超过1,000个,标志着公司在可观测性领域的领先地位 [2][6] - 在2025年Gartner数字体验监测魔力象限中被评为领导者,这是公司连续第二年获此认可,并在执行能力方面获得最高评价 [6] 产品创新与市场拓展 - 公司快速创新以帮助客户解决AI领域的问题,近期发布了全栈AI可观测性与安全产品、面向SRE、开发者和安全的Bits AI Agents、Datadog MCP Server以及时间序列基础模型TOTO [3] - 扩大对Oracle云基础设施的支持,包括新增GPU监控、云成本管理和云SIEM集成,以帮助团队在OCI环境中获得全栈可见性和安全性 [6] - Datadog for Government现已进入GovRAMP High授权流程,强化了其为公共部门提供安全、可扩展可观测性的承诺 [6] 管理层与公司治理 - 任命Ami Vora为公司董事会成员,其拥有超过20年领导全球广泛使用产品的产品和设计团队的经验,曾任职于Faire、WhatsApp、Meta和微软 [6] - 公司首席执行官Olivier Pomel表示,Datadog在第三季度表现强劲,收入增长显著,现金流健康 [3] 业绩展望 - 第四季度收入指引为9.12亿至9.16亿美元,非GAAP营业利润指引为2.16亿至2.20亿美元 [6] - 全年收入指引为33.86亿至33.90亿美元,非GAAP营业利润指引为7.54亿至7.58亿美元 [12] - 第四季度非GAAP摊薄后每股收益指引为0.54至0.56美元,全年指引为2.00至2.02美元 [12]
Datadog (DDOG) 2025 Conference Transcript
2025-06-10 23:02
纪要涉及的公司 - Datadog:一家提供软件服务的上市公司,专注于帮助用户应对技术复杂性和风险,提供多种产品和服务,包括AI代理、日志管理、安全防护、可观测性工具等 [1][3] - Thomson Reuters:使用Datadog的Bits来加速全球运营团队的问题分类 [20] - Fanatics:使用Datadog的Bits在重要赛事期间及时处理警报 [20] - Toyota Connected:与Datadog合作,借助其可观测性工具实现车辆系统的高可用性,核心产品包括DriveLink、mobility、Hey Toyota、multimedia等,目前有超1250万辆车通过这些系统连接 [110][112][113] - Okta:领先的独立中立身份公司,Auth0是其开发者友好的客户身份平台,使用Datadog的FlexLogs实现更快的根本原因分析和事件解决,节省成本并降低缓解时间 [133][134] - Cursor:一款受用户喜爱的AI编码工具,与Datadog合作,借助其数据和工具提升开发效率 [87] - Ramp:帮助超35000家公司控制支出、自动化会计和管理供应商,通过数据可观测性解决资本运营和产品方面的数据问题,如价格情报产品 [198][200][202] 纪要提到的核心观点和论据 产品创新与升级 - **Bits AI系列代理** - **Bits AI SRE**:能像SRE一样主动调查生产问题,通过分析更多数据、进行更深入的根本原因分析和拥有记忆功能,处理复杂任务,如解决Flight Query API端点的高延迟问题,已被Thomson Reuters和Fanatics等公司使用 [10][11][20] - **Bits AI Security Analyst**:可自动调查SIM信号,推荐分类解决方案并展示调查步骤,减少SOC团队的分类时间,如将调查时间从30分钟缩短到30秒,还能进行安全行动建议和自动创建案例 [40][43][48] - **Bits AI Dev Agent**:深度集成在Datadog平台,利用可观测性数据自主检测高影响问题、诊断根本原因并创建上下文感知的拉取请求,每月自动发送超1000个PR,为团队节省大量工程时间 [50][58] - **OnCall和事件响应** - **OnCall**:已推向一般可用性,超千家公司使用其改进值班流程,新的语音界面可实时获取监控细节、下一步操作并采取行动,如处理结账关键延迟警报 [22][30] - **状态页面**:新推出的Datadog状态页面可帮助用户轻松更新公司状态页面,支持模板、自定义域名等,实现端到端的事件处理流程 [35][36] - **APM相关功能** - **APM investigator**:处于预览阶段,可帮助用户快速解决延迟问题,如在几分钟内解决结账端点的延迟问题,还能解决应用效率低下、部署故障等问题 [60][61][71] - **主动应用建议**:处于预览阶段,通过分析APM、DBM、RUM和分析数据,提供性能和可靠性改进建议,如减少服务延迟、解决页面问题等,可在问题影响业务前进行处理 [65][70][71] - **IDP(内部开发者门户)**:是唯一能自动了解系统并保持最新状态的开发者门户,可帮助工程师轻松理解服务、跟踪最佳实践并使用AI管理基础设施,如通过软件目录、记分卡和自助服务操作等功能提高开发效率 [75][84][85] - **MCP Server**:允许代理访问Datadog数据和功能,帮助调试问题,如通过与Cursor集成,利用Datadog的实时锁点解决结账按钮无响应问题,并生成更准确的单元测试和修复方案 [93][95][99] - **日志管理** - **Flex Frozen**:新的长期存储层,可将日志在Datadog中完全管理长达7年,满足审计、安全漏洞调查和合规审查等需求 [121] - **Archive Search**:强大的日志搜索功能,可在不同存储位置查找日志洞察,快速生成合规报告,无需编写复杂查询或等待长时间的恢复作业 [122][123] - **Sheets**:原生电子表格解决方案,用于切片和切块日志数据或构建实时报告,方便分析师和审计人员进行数据分析 [124] - **Notebooks**:用于交互式绘图和协作分析,可将不同的遥测和上下文数据整合到一个统一的画布中,支持多步骤分析和团队协作,还集成了Bits AI进行数据分析 [125][126][127] - **安全防护** - **Datadog Security**:为AI应用的每个层提供安全保护,包括数据层防止敏感数据泄漏、模型层防止模型被操纵和应用层防止代码和云环境受到攻击,已推出超400个新功能和检测,7500家客户使用 [148][149][159] - **AI Agent Monitoring**:帮助用户构建更好的自定义代理并观察其性能,通过代理执行流程图、代理清单、实验等功能解决代理决策和工具选择不可靠的问题 [172][174][182] - **AI Agents Console**:可监控企业堆栈中所有AI代理的行为和交互,提供关键见解,如每月成本、错误率等,帮助用户检测低效代理并进行深入调查,确保代理安全、有效运行并提供可衡量的业务价值 [187][188][192] - **可观测性** - **GPU Monitoring**:提供对GPU舰队的全面可见性,解决资源争用、数据传输拥塞和成本浪费问题,如通过监控发现集群中的低效工作负载并进行优化 [161][162][168] - **LLM Observability**:从简单监控到支持自定义AI代理的观测,新增AI Agent Monitoring功能,帮助用户构建和操作LLM应用,确保输出可靠 [170][171][172] - **Data Observability**:处于预览阶段,通过结合深度数据质量检查和机器学习模型,覆盖整个数据生命周期,帮助用户检测问题、解决问题并防止问题发生,如解决金融运营公司的报价价格问题 [207][208][215] 客户案例与合作 - **Cursor**:在过去6个月基础设施规模扩大超100倍,Datadog帮助其实现可观测性扩展,避免崩溃,未来希望结合Datadog数据和Cursor能力提高生产力 [88] - **Toyota Connected**:通过Datadog的可观测性工具实现车辆系统的四个九的正常运行时间,将问题识别时间从分钟缩短到秒,DriveLink等核心产品已连接超1250万辆车 [113][115][118] - **Okta**:使用FlexLogs实现日志的单一视图,加快根本原因分析和事件解决,节省成本并降低缓解时间,同时与Datadog合作应对AI时代的安全挑战 [134][135] - **Ramp**:通过数据可观测性解决资本运营和产品方面的数据问题,如帮助资本市场团队信任数据、让客户信任价格情报产品 [200][202][204] 其他重要但是可能被忽略的内容 - **开源贡献**:Datadog的AI实验室发布了最先进的时间序列基础模型TOTO和相关基准BOOM,并以开放权重的方式在hugging face上免费提供,促进开放科学发展 [7][8] - **与OpenAI合作**:Datadog与OpenAI合作,将可操作上下文引入其新的Codec CLI,使SRE能够在终端中与AI代理协作,通过自然语言解决问题,无需在应用之间切换 [103][104][106] - **日志存储增长**:FlexLogs推出不到一年,团队每月存储的数据超过100PB,成为Datadog历史上增长最快的产品 [121] - **模型训练失败原因**:30%的模型训练失败是由于GPU问题,且GPU集群经常闲置,而SRE和ML工程师缺乏对GPU如何影响AI工作负载的端到端可见性 [161] - **AI代理部署趋势**:82%的组织计划在未来1 - 3年内在生产环境中部署AI代理,超60%的客户强调对AI代理信任的重要性 [138]