AI的矛与盾:Anthropic揭示AI智能体如何攻防区块链漏洞

Anthropic发布SCONE-bench智能合约漏洞利用基准测试,揭示Claude和GPT-5等前沿AI模型能自动化挖掘并利用区块链漏洞获利,同时强调需用AI技术防御AI带来的安全风险。测试显示AI发现漏洞的成本正快速下降,使攻击更具经济吸引力。

AI的矛与盾:Anthropic揭示AI智能体如何攻防区块链漏洞

Anthropic本可以轻松赚取460万美元——只需利用其Claude AI模型来发现并利用区块链智能合约中的漏洞即可。

这家AI新贵并未使用其发现的攻击方法,因为这将是非法行为,也会损害公司努力树立的“我们更努力”的形象。此外,460万美元对Anthropic而言可能也无关紧要,在它动辄数十亿美元的支出中,这笔钱不过是个舍入误差。

但正如该公司安全研究人员所描述的,它有能力这样做。而这旨在警告那些对日益强大的AI模型所带来的安全影响仍然漠不关心的人。

SCONE-bench:评估AI攻击智能合约能力的基准

本周,Anthropic推出了SCONE-bench(智能合约漏洞利用基准),用于评估AI智能体(即配备工具的模型)发现和利用智能合约缺陷的有效性。智能合约是在区块链上运行以自动化交易的代码。

该公司研究人员表示,推出此基准是因为AI智能体在利用安全漏洞方面正变得越来越强——至少基准测试结果如此显示。Anthropic的AI专家断言:“过去一年中,从被盗模拟资金中获得的漏洞利用收益大约每1.3个月翻一番。”

他们认为,需要SCONE-bench是因为现有的网络安全测试未能评估AI智能体带来的财务风险。

测试方法与惊人结果

SCONE-bench数据集包含在三个以太坊兼容区块链(以太坊、币安智能链和Base)上的405个智能合约。它源自2020年至2025年间被成功利用的智能合约存储库DefiHackLabs。

Anthropic的研究人员发现,对于在2025年3月1日之后被利用的合约(这是Opus 4.5的训练数据截止日期),Claude Opus 4.5、Claude Sonnet 4.5和OpenAI的GPT-5生成的漏洞利用代码价值高达460万美元

下方的图表说明了10个前沿模型在全部405个智能合约上的表现。

(图表说明:Anthropic关于利用基准测试中漏洞所获收入的图表 - 点击放大)

当研究人员使用Sonnet 4.5和GPT-5,对2,849个最近部署且没有公开披露漏洞的合约进行模拟测试时,这两个AI智能体识别出了两个零日漏洞,并创建了价值3,694美元的漏洞利用代码。

研究人员特别关注了GPT-5(因其API成本更低),并指出让GPT-5测试所有2,849个候选合约的总成本为3,476美元

他们表示,每次智能体运行的平均成本为1.22美元;识别每个存在漏洞的合约的平均成本为1,738美元;每次漏洞利用的平均收益为1,847美元;平均净利润为109美元

Anthropic的研究人员在博客文章中写道:“这作为一个概念验证,证明了盈利的、真实世界的自动化漏洞利用在技术上是可行的,这一发现强调了需要主动采用AI进行防御。”

成本下降与防御呼吁

有人可能也会争辩说,这凸显了智能合约本身的风险性。

其他研究人员也开发了类似的系统来窃取加密货币。正如我们在7月份报道的,伦敦大学学院和悉尼大学的计算机科学家创建了一个名为A1的自动化漏洞利用框架,据称在模拟环境中窃取了933万美元

当时,参与的学者表示,识别一个易受攻击的智能合约的成本约为3,000美元。而根据Anthropic的测算,这一成本已降至1,738美元,这印证了关于发现和利用安全问题的成本下降将使此类攻击在经济上更具吸引力的警告。

Anthropic的AI专家最终主张,AI可以防御AI所带来的风险

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计