简要概述
- Anthropic 正在准备推出 Claude Opus 4.7 以及一个用于网站和演示文稿的 AI 设计工具
- Claude Mythos 仍然是 Anthropic 真正的前沿模型,该公司不会公开发布它。
- 该行业仍然无法可靠地衡量 AI 的改进,这使得关于 Opus 4.7 提升的说法难以验证。
根据 The Information 报道,Anthropic 正准备发布 Claude Opus 4.7,同时推出一个新的 AI 驱动设计工具,让用户可以使用简单的英语提示来构建网站、演示文稿和着陆页——这一消息导致 Adobe、Wix 和 Figma 的股价在周一下跌。
一位知情人士告诉 The Information,这些产品最快可能在本周发布。该设计工具面向开发者和非技术用户,这使其与 Gamma 和 Google 的 Stitch 等初创公司产生正面竞争。
Anthropic 没有回应 Decrypt 的评论请求。
Opus 4.7 甚至不是 Anthropic 最强大的模型。这个称号属于 Claude Mythos——一个专注于网络安全的强大模型,该公司正悄悄地将其交给精选的安全公司,同时不向公众发布。
英国 AI 安全研究所最近评估了 Mythos Preview,发现它能够以其他模型无法匹敌的速度自主执行复杂的网络攻击。它成为第一个完成"The Last Ones"的 AI,这是一个 32 步的企业网络攻击模拟,通常需要人类红队 20 小时完成。Mythos 在十次尝试中成功了三次,平均完成 32 步中的 22 步——而 Opus 4.6 只有 16 步。
这个问题超越了企业安全范畴。衡量 AI 实际能做什么已经成为整个行业的难题。OpenAI 最近称领先的编码基准"被污染",但模型仍然继续使用这些相同的测试进行比较。在一个单独的 ARC-AGI-3 评估中,Gemini 得分 0.37%,GPT-5.4 达到 0.26%——而人类得到 100%。结果是基准既受到质疑又仍被用作证据,这使得在 Anthropic 发布详细的模型卡之前,很难理解关于 Opus 4.7 提升的说法。
Opus 和 Mythos 之间的关系比大多数人意识到的更紧密。Anthropic 通过在 Opus 系列之上进行微调来构建其前沿模型——支持公共 Claude 产品的相同主干经过压力测试和强化后成为 Mythos。Opus 4.7 是最终被注入网络安全功夫的基础。
此外,Anthropic 的努力一直更多地转向开发/企业用例。Claude 代码的泄露、技能系统和 MCP 协议的发布、对代理 AI 的关注以及对编码基准的重视使这一点更加明显。虽然 Anthropic 还没有正式宣布,但泄露加强了从 LLM 提供商向类似全栈"AI 工作室"模型的更广泛转变,在这种模式下,Claude 不仅生成文本,还构建和部署完整的产品。
每日简报通讯
每天以最新热门新闻开始,还有原创专题、播客、视频等更多内容。
来源: https://decrypt.co/364483/anthropic-opus-47-full-stack-ai-studio-mythos








