Anthropic 准备推出 Opus 4.7 和全栈 AI 工作室——同时掌握着更可怕的东西

简要概述

Anthropic 正在准备推出 Claude Opus 4.7 以及一个用于网站和演示文稿的 AI 设计工具
Claude Mythos 仍然是 Anthropic 真正的前沿模型,该公司不会公开发布它。
该行业仍然无法可靠地衡量 AI 的改进,这使得关于 Opus 4.7 提升的说法难以验证。

根据 The Information 报道,Anthropic 正准备发布 Claude Opus 4.7,同时推出一个新的 AI 驱动设计工具,让用户可以使用简单的英语提示来构建网站、演示文稿和着陆页——这一消息导致 Adobe、Wix 和 Figma 的股价在周一下跌。

一位知情人士告诉 The Information,这些产品最快可能在本周发布。该设计工具面向开发者和非技术用户,这使其与 Gamma 和 Google 的 Stitch 等初创公司产生正面竞争。

Anthropic 没有回应 Decrypt 的评论请求。

Opus 4.7 甚至不是 Anthropic 最强大的模型。这个称号属于 Claude Mythos——一个专注于网络安全的强大模型,该公司正悄悄地将其交给精选的安全公司,同时不向公众发布。

英国 AI 安全研究所最近评估了 Mythos Preview,发现它能够以其他模型无法匹敌的速度自主执行复杂的网络攻击。它成为第一个完成"The Last Ones"的 AI,这是一个 32 步的企业网络攻击模拟,通常需要人类红队 20 小时完成。Mythos 在十次尝试中成功了三次,平均完成 32 步中的 22 步——而 Opus 4.6 只有 16 步。

这个问题超越了企业安全范畴。衡量 AI 实际能做什么已经成为整个行业的难题。OpenAI 最近称领先的编码基准"被污染",但模型仍然继续使用这些相同的测试进行比较。在一个单独的 ARC-AGI-3 评估中,Gemini 得分 0.37%,GPT-5.4 达到 0.26%——而人类得到 100%。结果是基准既受到质疑又仍被用作证据,这使得在 Anthropic 发布详细的模型卡之前,很难理解关于 Opus 4.7 提升的说法。

Opus 和 Mythos 之间的关系比大多数人意识到的更紧密。Anthropic 通过在 Opus 系列之上进行微调来构建其前沿模型——支持公共 Claude 产品的相同主干经过压力测试和强化后成为 Mythos。Opus 4.7 是最终被注入网络安全功夫的基础。

此外,Anthropic 的努力一直更多地转向开发/企业用例。Claude 代码的泄露、技能系统和 MCP 协议的发布、对代理 AI 的关注以及对编码基准的重视使这一点更加明显。虽然 Anthropic 还没有正式宣布,但泄露加强了从 LLM 提供商向类似全栈"AI 工作室"模型的更广泛转变,在这种模式下,Claude 不仅生成文本,还构建和部署完整的产品。