Together AI 推出 DeepSeek-V3.1：一个多功能混合模型

Terrill Dicki
2025年8月25日 23:56

Together AI推出DeepSeek-V3.1，这是一款混合模型，提供快速响应和深度推理模式，确保各种应用的效率和可靠性。

Together AI推出了DeepSeek-V3.1，这是一款先进的混合模型，旨在满足快速响应需求和复杂推理任务。该模型现已在Together AI平台上可供部署，其双模式功能尤为引人注目，允许用户根据任务复杂度在非思考模式和思考模式之间进行选择，以优化性能。

特点和功能

据Together AI介绍，DeepSeek-V3.1旨在提供增强的效率和可靠性。它支持无服务器部署，具有99.9%的服务水平协议(SLA)，确保在各种用例中的强大性能。该模型的思考模式提供与其前身DeepSeek-R1相当的质量，但在速度方面有显著提升，使其适合生产环境。

该模型建立在庞大的训练数据集上，32K上下文拥有6300亿个标记，128K上下文拥有2090亿个标记，增强了其处理延长对话和大型代码库的能力。这确保了模型能够胜任需要详细分析和多步骤推理的任务。

DeepSeek-V3.1在各种应用中表现出色，包括代码和搜索代理任务。在非思考模式下，它能高效处理常规任务，如API端点生成和简单查询。相比之下，思考模式则适合复杂问题解决，如调试分布式系统和设计零停机时间的数据库迁移。

对于文档处理，该模型提供非思考能力用于实体提取和基本解析，而思考模式则支持对合规工作流程和监管交叉引用的全面分析。

基准测试揭示了该模型在两种模式下的优势。例如，在MMLU-Redux基准测试中，思考模式达到了93.7%的成功率，超过非思考模式1.9%。同样，GPQA-Diamond基准测试显示思考模式提高了5.2%。这些指标凸显了该模型在各种任务中提升性能的能力。

DeepSeek-V3.1通过Together AI的无服务器API和专用端点提供，提供技术规格，包含6710亿总参数，并采用MIT许可证以供广泛应用。其基础设施设计注重可靠性，具有北美数据中心和SOC 2合规性。

开发人员可以使用提供的Python SDK迅速将该模型集成到他们的应用程序中，实现DeepSeek-V3.1功能与现有系统的无缝结合。Together AI的基础设施支持大型专家混合模型，确保思考和非思考模式在生产工作负载下高效运行。

随着DeepSeek-V3.1的推出，Together AI旨在为寻求增强其AI驱动应用程序的企业提供一个多功能解决方案，同时具备快速响应和深度分析能力。

图片来源：Shutterstock

来源：https://blockchain.news/news/together-ai-launches-deepseek-v3-1-versatile-hybrid-model