Workflow
CryptoBench
icon
搜索文档
OpenAI 发布智能合约基准测试,这意味着什么?
新浪财经· 2026-02-20 15:17
OpenAI发布智能合约基准测试EVMbench - OpenAI发布了一项名为evmbench的智能合约基准测试,用于衡量AI智能体在加密环境中的生存和行动能力[2] - 该基准测试基于现实世界中40个真实项目里发生的120个高危漏洞[3] - 测试分为三个科目:寻找漏洞、修补漏洞以及模拟黑客攻击[3] 基准测试的目的与行业意义 - 该测试是OpenAI内部“Preparedness Framework”的延伸,旨在评估前沿模型在高风险场景下的能力边界,智能合约安全是其中一部分[4] - OpenAI认为,智能体利用加密网络在某种程度上是一种必然,并明确提到“we expect agentic stablecoin payments to grow”[4] - 发布此基准测试表明OpenAI有主动意愿探索加密领域,而不仅仅是配合投资机构Paradigm[3] 智能体经济的未来形态与基础设施需求 - 当前大多数智能体仍是工具属性,但未来形态将演变为智能体之间直接协作,人类可能退出交易的中间环节[4][5] - 为人类设计的、基于法律和声誉的信任体系不适用于智能体,因为智能体可以快速发起交易、销毁身份且无视司法边界[6] - 将人类身份与智能体强行绑定以提供担保的做法是低效且从根本上误解了智能体的本质,未来的智能体可能具有高度自主性且不依附于任何人类个体[7] 智能合约作为智能体社会的基础设施 - 智能合约通过代码强制执行履约条件,不依赖对“人”的信任,为智能体社会提供了可能的基础设施[9] - 智能合约可能成为智能体的组织形态本身,治理规则、资源分配和任务调度都可在链上定义和执行[9] - 当智能体“生活”在链上,与合约交互成为其日常,理解、运用合约以及识别风险的能力是其生存的关键[9] - evmbench测试的能力(读懂合约、发现漏洞、构造交易等)本质上是在回答“智能体是否已学会在这个新世界生存”的问题[9] 行业内的相关研究背景 - 作者在一年半前曾发布名为CryptoBench的项目,这是第一个检测AI在加密领域能力的基准测试,涵盖了密码学、区块链底层、智能合约、DAO治理等多方面[10] - CryptoBench的智能合约部分同样包含漏洞检测和修复,其参考的漏洞集与OpenAI此次使用的部分相同[10]