Terrill Dicki
2025年8月25日 23:56
Together AI推出DeepSeek-V3.1,这是一款混合模型,提供快速响应和深度推理模式,确保各种应用的效率和可靠性。
Together AI推出了DeepSeek-V3.1,这是一款先进的混合模型,旨在满足快速响应需求和复杂推理任务。该模型现已在Together AI平台上可供部署,其双模式功能尤为引人注目,允许用户根据任务复杂度在非思考模式和思考模式之间进行选择,以优化性能。
特点和功能
据Together AI介绍,DeepSeek-V3.1旨在提供增强的效率和可靠性。它支持无服务器部署,具有99.9%的服务水平协议(SLA),确保在各种用例中的强大性能。该模型的思考模式提供与其前身DeepSeek-R1相当的质量,但在速度方面有显著提升,使其适合生产环境。
该模型建立在庞大的训练数据集上,32K上下文拥有6300亿个标记,128K上下文拥有2090亿个标记,增强了其处理延长对话和大型代码库的能力。这确保了模型能够胜任需要详细分析和多步骤推理的任务。
实际应用
DeepSeek-V3.1在各种应用中表现出色,包括代码和搜索代理任务。在非思考模式下,它能高效处理常规任务,如API端点生成和简单查询。相比之下,思考模式则适合复杂问题解决,如调试分布式系统和设计零停机时间的数据库迁移。
对于文档处理,该模型提供非思考能力用于实体提取和基本解析,而思考模式则支持对合规工作流程和监管交叉引用的全面分析。
性能指标
基准测试揭示了该模型在两种模式下的优势。例如,在MMLU-Redux基准测试中,思考模式达到了93.7%的成功率,超过非思考模式1.9%。同样,GPQA-Diamond基准测试显示思考模式提高了5.2%。这些指标凸显了该模型在各种任务中提升性能的能力。
部署和集成
DeepSeek-V3.1通过Together AI的无服务器API和专用端点提供,提供技术规格,包含6710亿总参数,并采用MIT许可证以供广泛应用。其基础设施设计注重可靠性,具有北美数据中心和SOC 2合规性。
开发人员可以使用提供的Python SDK迅速将该模型集成到他们的应用程序中,实现DeepSeek-V3.1功能与现有系统的无缝结合。Together AI的基础设施支持大型专家混合模型,确保思考和非思考模式在生产工作负载下高效运行。
随着DeepSeek-V3.1的推出,Together AI旨在为寻求增强其AI驱动应用程序的企业提供一个多功能解决方案,同时具备快速响应和深度分析能力。
图片来源:Shutterstock
来源:https://blockchain.news/news/together-ai-launches-deepseek-v3-1-versatile-hybrid-model


