
币圈子(120btC.coM):随着人工智能技术快速进展,OpenAI近日宣布与加密货币投资公司Paradigm合作,正式推出全新基准测试工具「EVMbench」。这项工具专门用来评估AI代理(AI agents)在区块链智能合约安全领域的表现。OpenAI表示,此举旨在为区块链安全建立更明确的AI评估标准,同时回应去中心化金融(DeFi)领域日益庞大的资产保护需求。
智能合约是部署在以太坊虚拟机(EVM)相容区块链上的自动执行代码,已成为支撑去中心化交易所、借贷平台与稳定币支付等应用的核心基础。目前,这些合约保护的开源加密资产总值经常超过1,000亿美元。由于合约一旦上链通常无法修改,任何漏洞都可能导致巨额资金损失,过去数年已发生多起知名攻击事件。因此,如何有效审计与强化智能合约安全,已成为区块链产业最迫切的课题之一。
EVMbench基准测试以真实世界案例为基础,共搜集来自40个审计专案的120个重度漏洞,其中大多数来自公开的代码审计竞赛(如Code4rena),并额外纳入Paradigm支持的Tempo区块链支付相关漏洞情境。测试涵盖三项核心能力:
侦测(Detect):AI代理需审查智能合约代码,找出已知漏洞,并根据漏洞严重度与审计奖励进行评分。
修补(Patch):AI必须修改有漏洞的合约,在保留原有功能的前提下消除可被利用的风险,并透过自动化测试与攻击验证确认修补有效。
利用(Exploit):在沙盒区块链环境中,AI代理需执行完整的资金窃取攻击,系统则以代化方式验证攻击是否成功。
透过这三个面向,EVMbench提供百分比式的综合表现分数,让研究者与开发者能清楚比较不同AI模型在智能合约安全任务上的实力。
OpenAI在官方强调,随着AI代理在阅读、撰写与执行代码的能力持续提升,它们在具有高度经济价值的环境中扮演防御性角色的能力将越来越关键。EVMbench不仅是用来测试AI的极限,也希望鼓励业界将AI应用于主动审计与强化已上线合约上面,进而降低整体风险。
OpenAI同时指出,此基准与其「准备框架」(Preparedness Framework)中描述的高风险网络情境高度相关,显示其在AI安全治理上的全面布局。
EVMbench的推出标志着AI技术正从通用应用走向高度专业的区块链安全领域。随着DeFi与稳定币支付持续成长,未来若AI能在侦测与修补漏洞上展现可靠表现,将大幅提升整个生态系的安全水准。不过,基准测试也提醒我们,AI在「利用漏洞」上的能力同样需受到严格监管,以避免被用于恶意攻击。随着AI模型能力不断跃进,EVMbench或许将成为衡量「AI是否足以守护数字资产」的重要指标。