Workflow
Promptfoo开源评测框架
icon
搜索文档
OpenAI为龙虾紧急收购了一家23人公司
量子位· 2026-03-10 16:00
OpenAI收购Promptfoo的战略布局 - OpenAI近期收购了专注于AI安全与评测的初创公司Promptfoo,旨在加强其在智能体(文中喻为“龙虾”)时代的安全能力[1][4][8] - 此次收购紧随OpenAI挖来“龙虾之父”Peter Steinberger之后,是其布局智能体协作领域的关键一步[1][52] 被收购方Promptfoo公司概况 - Promptfoo成立于2024年,是一个由23人组成的小团队,其核心产品是AI应用评测领域最流行的开源框架之一[10][17][21] - 公司两位联合创始人背景深厚,CEO曾任Discord LLM工程与开发者平台负责人,CTO曾任数字身份认证公司Smile Identity的工程副总裁及AI主管[11] - 公司在开源社区影响力显著,其框架拥有超过30万开发者用户,GitHub上获得11.2K星标,在被收购前,OpenAI、Anthropic、亚马逊等公司已是其用户[5][6] - 公司商业化进展迅速,拥有超过35万名开发者用户,月度活跃用户达13万,财富500强企业中超过25%(约125家)的团队使用其产品[17] - 公司在2025年7月完成了由Insight Partners领投、a16z参投的1840万美元(约合人民币1.27亿元)A轮融资,投后估值达到8600万美元(约合人民币5.92亿元)[18][20] Promptfoo的核心产品与技术能力 - Promptfoo的核心产品是一个开源评测框架,旨在解决大模型难以测试的工程化问题,将AI应用测试转变为标准化的工程流程[21][22][25] - 框架具备三大核心能力:一是自动化评测,允许开发者批量测试不同提示词和模型并自动评估输出效果[25];二是AI红队演练,模拟真实用户攻击以发现LLM应用潜在漏洞并生成安全报告[29];三是工程化集成,可嵌入CI/CD流程自动运行测试与安全扫描[31] - 该框架支持网页可视化界面和命令行工具,允许开发者在本地或服务器运行大规模评测任务[33] - 公司的长期愿景是使其框架成为AI领域的“标配工具”,类似于持续集成在DevOps中的地位,确保每次引入新模型或更改提示词时都能自动评估与测试[34][35] 行业背景与收购动因 - 行业正进入“智能体时代”,智能体被赋予访问邮箱、文档、数据库及调用各类API的高权限,其操作失误可能带来真实世界风险,使得安全性成为企业部署的刚性需求[7][45][46][47][49] - 智能体(龙虾)的流行与随之暴露的安全问题(如著名删邮件事件)使得市场对安全工具的需求变得刻不容缓[42][44] - 互联网为智能体重构呈现四大趋势:多智能体协作、MCP成为标准协议、语音交互爆发、测试驱动开发,Promptfoo的使命正从提示词评测工具进化为智能体时代的安全基础设施[37][38][39] 收购后的整合与影响 - Promptfoo被收购后将保持开源和独立运营,其技术将被整合进OpenAI的智能体创建和运行平台“OpenAI Frontier”中[9][56][57] - 此次收购被视为双赢,既补全了OpenAI在智能体安全方面的关键能力,也使Promptfoo的技术能更广泛地应用于前沿平台[8][58] - 在智能体时代,能自动执行任务的智能体本身也可成为评测大模型真实能力的新工具,推动了行业评测标准从“刷榜”向实战能力检验的演进[59]