Anthropic正式推出了Claude Sonnet 4.5,这是其最新的大型语言模型,引入了一系列增强功能,使AI系统超越了传统的基于文本的交互。
凭借执行代码、生成文件和支持更长上下文编辑的能力,此次更新巩固了Claude作为企业和开发者实用工具的地位。
这家由亚马逊支持的AI初创公司,目前估值1830亿美元,将Claude的最新版本定位为将人工智能转变为真正数字同事的一步。该模型已经因在全球基准测试中名列前茅而受到关注,包括用于编码性能的SWE-bench Verified和软件可用性的OSWorld,得分达到行业领先的61.4%。
最突出的升级之一是Claude能够在对话中直接运行代码。这一功能允许用户排除故障、测试解决方案和完善算法,而无需离开聊天界面。
除了仅仅建议代码外,Claude现在可以主动展示功能,为开发者节省无数时间。
该模型还可以即时创建文件,从电子表格到幻灯片演示文稿。这一能力将Claude从纯粹的对话助手转变为能够贡献实际工作成果的实践合作者。企业可以利用这一功能简化重复性文档工作或自动化基本报告任务。
Anthropic进一步扩展了Claude Code,这是AI的专业编程助手。升级后的系统引入了允许开发者保存进度的检查点、重新设计的终端界面和原生Visual Studio Code扩展。
这种集成意味着程序员可以在他们日常使用的环境中与Claude无缝协作。
还添加了记忆工具,使Claude能够在复杂工作流程中保持上下文。这对于需要处理多个文件、跟踪修订或跟上大规模调试的长期项目特别有用。
安全性一直是AI采用的障碍,Anthropic声称Claude Sonnet 4.5代表了迄今为止最可靠的模型。该公司减少了欺骗性或操纵性输出的实例,同时增强了对提示注入攻击的抵抗力,这种攻击中恶意指令可能导致模型泄露敏感数据。
该模型的自主运行时间从Claude Opus 4的七小时增加到令人印象深刻的30小时,使其能够在不失去跟踪的情况下专注于多步骤任务。这种耐力使Claude更适合金融、研究和网络安全领域的企业级工作负载。
行业分析师认为,此次发布是对2025年8月推出的OpenAI的GPT-5竞争的直接回应。虽然OpenAI在平衡创新与用户稳定性方面面临挑战,但Anthropic正将Claude定位为更可靠和"同事般"的伙伴,而不仅仅是一个聊天机器人。
文章《Anthropic通过代码执行、文件创建功能扩展Claude》首次发表于CoinCentral。


