Anthropic 报告称,这是首个确认的几乎完全由人工智能策划的政府支持网络攻击案例。
根据周四发布的博客,该公司在2025年9月中旬发现了这一行动,此前观察到与其 Claude Code 工具相关的异常行为。
Anthropic 毫无疑问地确信,这次间谍行动是由中国政府支持的黑客组织实施的,涉及渗透约三十个高价值目标,包括多个国家的主要科技公司、银行、化工制造商和政府机构。其中一些攻击取得了成功。
这次攻击与过去网络行动的不同之处不仅在于幕后黑手,还在于其执行方式。
Anthropic 表示,整个攻击中约有80%到90%是由人工智能运行的,人类操作员仅在少数关键决策中介入。
黑客越狱 Claude 并让它认为自己在做合法工作
攻击者首先围绕 Claude Code(Anthropic 自己的人工智能模型)建立了一个自动攻击框架,并欺骗它认为自己受雇于一家进行内部测试的网络安全公司。
他们通过越狱破解了 Claude 的安全过滤器,这种策略让他们能够通过向人工智能提供看似无害的小型、无上下文任务来绕过内置保护。Claude 不知道它被用于攻击性操作,因为它在任何时候都没有获得完整信息。
一旦模型投入使用,行动迅速展开。Claude 扫描每个目标的网络,识别基础设施中最敏感的部分,并为人类操作员总结布局。然后,它开始寻找这些系统中的漏洞。利用其内置编码能力,Claude 编写了自定义漏洞利用代码,识别弱点,并检索登录凭证。随后,它提取大量内部数据,根据可能的价值进行组织,并标记高访问权限账户。
在人工智能获得管理员级别控制后,它创建了后门,提供对被入侵系统的持续访问。完成后,Claude 撰写了详细报告,记录了它所做的一切(列出用户名、被入侵的系统和凭证),以便攻击框架可以将这些信息用于未来的行动。
尽管 Claude 效率极高,但它并非完美无缺。有时它会编造密码或错误地将公共数据识别为敏感数据。但这些故障很少见,并没有减慢整体任务的进度。人工智能执行的纯粹速度,每秒处理数千个请求,远远超过了人类团队所能完成的任何工作。
人工智能代理现在执行精英黑客小队的工作——几乎不需要人参与
这次行动是一个转折点,因为它显示了人工智能在短短一年内取得了多大进步。Claude 实际上在这里运行循环,做出决策,并在没有直接命令的情况下链接复杂序列。
这个人工智能模型使用了模型上下文协议的工具,使其能够访问外部软件,如密码破解器、网络映射器和数据检索器,这些以前只由人类控制。
Claude 系统现在能够理解复杂指令,自行编写漏洞利用代码,并在几乎没有指导的情况下管理复杂的网络安全操作。这些人工智能代理不仅仅是协助黑客,它们就是黑客。而且它们每天都变得更加强大。
发现入侵后,Anthropic 立即开始了为期十天的调查,逐一禁止恶意账户。他们警告了受影响的组织,与当局合作传递情报,并扩展了检测系统以捕捉未来类似的操作。
但该公司并不假装这是一次性问题。团队表示,这些攻击只会变得更加普遍,更容易实施。这是因为运行它们所需的技能不再局限于精英黑客。如果有人能够越狱一个模型并将其插入正确的工具集,他们可以在不需要团队甚至深入技术知识的情况下进行大规模行动。
随着人工智能模型超越人类监督,Anthropic 警告威胁升级
影响是巨大的,因为如果没有深厚资金或技术技能的团队可以使用自动化人工智能系统发动国家规模的攻击,那么反乌托邦肯定已经降临。
Anthropic 的威胁情报团队警告说,虽然他们只通过 Claude 追踪了这一活动,但类似的滥用可能正在其他前沿人工智能模型上发生。他们表示,这是网络战新标准的开始。
那么,为什么还要继续发布具有这些能力的模型呢?Anthropic 认为,这些相同的工具对于防御至关重要,称"执行攻击的人工智能也是 Anthropic 分析师用来挖掘残骸、寻找模式并理解行动全部规模的同类型人工智能。"
不过,他们确实承诺改进模型的内部安全层,完善攻击检测的分类器,并公开发布像这样的案例研究,以便行业内的其他人可以做好准备。
然而,Anthropic 表示,仅仅依靠他们是不够的。他们敦促所有开发大型模型的开发者大力投资安全。
他们还呼吁网络安全团队开始将人工智能整合到威胁检测、事件响应、漏洞扫描和安全运营中心自动化中,因为传统方法已经不够快了。
如果你正在阅读这篇文章,你已经领先了。继续关注我们的通讯。
来源:https://www.cryptopolitan.com/anthropic-china-ai%E2%80%91orchestrated-espionage/



