Terrill Dicki
25 Agu 2025 23:56
Together AI memperkenalkan DeepSeek-V3.1, model hybrid yang menawarkan respons cepat dan mode penalaran mendalam, memastikan efisiensi dan keandalan untuk berbagai aplikasi.
Together AI telah meluncurkan DeepSeek-V3.1, model hybrid canggih yang dirancang untuk memenuhi kebutuhan respons cepat dan tugas penalaran kompleks. Model ini, yang kini tersedia untuk penerapan di platform Together AI, secara khusus dikenal dengan fungsionalitas mode ganda, memungkinkan pengguna memilih antara mode non-berpikir dan mode berpikir untuk mengoptimalkan kinerja berdasarkan kompleksitas tugas.
Fitur dan Kemampuan
DeepSeek-V3.1 dirancang untuk memberikan efisiensi dan keandalan yang ditingkatkan, menurut Together AI. Model ini mendukung penerapan serverless dengan SLA 99,9%, memastikan kinerja yang kuat di berbagai kasus penggunaan. Mode berpikir model ini menawarkan kualitas yang sebanding dengan pendahulunya, DeepSeek-R1, tetapi dengan peningkatan signifikan dalam kecepatan, menjadikannya cocok untuk lingkungan produksi.
Model ini dibangun di atas dataset pelatihan yang substansial, dengan 630 miliar token untuk konteks 32K dan 209 miliar token untuk konteks 128K, meningkatkan kemampuannya untuk menangani percakapan yang panjang dan basis kode yang besar. Hal ini memastikan bahwa model tersebut dilengkapi dengan baik untuk tugas-tugas yang memerlukan analisis mendetail dan penalaran multi-langkah.
Aplikasi Dunia Nyata
DeepSeek-V3.1 unggul dalam berbagai aplikasi, termasuk tugas agen kode dan pencarian. Dalam mode non-berpikir, model ini secara efisien menangani tugas rutin seperti pembuatan endpoint API dan kueri sederhana. Sebaliknya, mode berpikir ideal untuk pemecahan masalah kompleks, seperti debugging sistem terdistribusi dan merancang migrasi database tanpa downtime.
Untuk pemrosesan dokumen, model ini menawarkan kemampuan non-berpikir untuk ekstraksi entitas dan parsing dasar, sementara mode berpikir mendukung analisis komprehensif alur kerja kepatuhan dan referensi silang regulasi.
Metrik Kinerja
Tes benchmark mengungkapkan kekuatan model dalam kedua mode. Misalnya, dalam benchmark MMLU-Redux, mode berpikir mencapai tingkat keberhasilan 93,7%, melampaui mode non-berpikir sebesar 1,9%. Demikian pula, benchmark GPQA-Diamond menunjukkan peningkatan 5,2% dalam mode berpikir. Metrik ini menggarisbawahi kemampuan model untuk meningkatkan kinerja di berbagai tugas.
Penerapan dan Integrasi
DeepSeek-V3.1 tersedia melalui API serverless Together AI dan endpoint khusus, menawarkan spesifikasi teknis dengan total 671 miliar parameter dan lisensi MIT untuk aplikasi yang luas. Infrastruktur dirancang untuk keandalan, menampilkan pusat data Amerika Utara dan kepatuhan SOC 2.
Pengembang dapat dengan cepat mengintegrasikan model ke dalam aplikasi mereka menggunakan SDK Python yang disediakan, memungkinkan penggabungan kemampuan DeepSeek-V3.1 ke dalam sistem yang ada secara mulus. Infrastruktur Together AI mendukung model mixture-of-experts yang besar, memastikan mode berpikir dan non-berpikir beroperasi secara efisien di bawah beban kerja produksi.
Dengan peluncuran DeepSeek-V3.1, Together AI bertujuan untuk menyediakan solusi serbaguna bagi bisnis yang ingin meningkatkan aplikasi berbasis AI mereka dengan kemampuan respons cepat dan analisis mendalam.
Sumber gambar: Shutterstock
Sumber: https://blockchain.news/news/together-ai-launches-deepseek-v3-1-versatile-hybrid-model

