Darius Baruo
02 Des 2025 19:09
NVIDIA memperkenalkan Mistral 3, lini model AI baru, yang menawarkan akurasi dan efisiensi tak tertandingi. Dioptimalkan untuk GPU NVIDIA, model-model ini meningkatkan penerapan AI di berbagai industri.
NVIDIA telah meluncurkan keluarga model AI terbarunya, Mistral 3, yang menjanjikan akurasi dan efisiensi yang belum pernah ada sebelumnya bagi pengembang dan perusahaan. Seperti dilaporkan oleh blog pengembang NVIDIA, model-model ini telah dioptimalkan untuk penerapan di seluruh GPU NVIDIA, dari pusat data kelas atas hingga platform edge.
Keluarga Model Mistral 3
Keluarga Mistral 3 mencakup berbagai model yang disesuaikan untuk berbagai aplikasi. Ini menampilkan model multimodal dan multibahasa berskala besar yang jarang dengan 675 miliar parameter, bersama dengan model padat yang lebih kecil bernama Ministral 3, tersedia dalam ukuran parameter 3B, 8B, dan 14B. Setiap ukuran model hadir dalam tiga varian: Base, Instruct, dan Reasoning, menyediakan total sembilan model.
Model-model ini dilatih pada GPU NVIDIA Hopper dan dapat diakses melalui Mistral AI di Hugging Face. Pengembang dapat menerapkan model-model ini menggunakan berbagai format presisi model dan kerangka kerja sumber terbuka, memastikan kompatibilitas dengan berbagai GPU NVIDIA.
Performa dan Optimasi
Model Mistral Large 3 NVIDIA mencapai performa luar biasa pada platform GB200 NVL72, memanfaatkan serangkaian optimasi yang disesuaikan untuk model mixture of experts (MoE) besar. Dengan peningkatan performa hingga 10 kali lebih besar dari generasi sebelumnya, model Mistral Large 3 menunjukkan peningkatan signifikan dalam pengalaman pengguna, efisiensi biaya, dan penggunaan energi.
Peningkatan performa ini dikaitkan dengan TensorRT-LLM Wide Expert Parallelism NVIDIA, inferensi presisi rendah menggunakan NVFP4, dan kerangka kerja NVIDIA Dynamo, yang meningkatkan performa untuk beban kerja konteks panjang.
Penerapan Edge dan Keserbagunaan
Model Ministral 3, yang dirancang untuk penerapan edge, menawarkan fleksibilitas dan performa untuk berbagai aplikasi. Model-model ini dioptimalkan untuk NVIDIA GeForce RTX AI PC, DGX Spark, dan platform Jetson. Pengembangan lokal mendapat manfaat dari akselerasi NVIDIA, memberikan kecepatan inferensi yang cepat dan peningkatan privasi data.
Pengembang Jetson, khususnya, dapat memanfaatkan kontainer vLLM untuk mencapai pemrosesan token yang efisien, menjadikan model-model ini ideal untuk lingkungan komputasi edge.
Pengembangan Masa Depan dan Komunitas Sumber Terbuka
Ke depannya, NVIDIA berencana untuk meningkatkan model Mistral 3 lebih lanjut dengan optimasi performa mendatang seperti decoding spekulatif. Selain itu, kolaborasi NVIDIA dengan komunitas sumber terbuka seperti vLLM dan SGLang bertujuan untuk memperluas integrasi kernel dan dukungan paralelisme.
Dengan pengembangan ini, NVIDIA terus mendukung komunitas AI sumber terbuka, menyediakan platform yang kuat bagi pengembang untuk membangun dan menerapkan solusi AI secara efisien. Model Mistral 3 tersedia untuk diunduh di Hugging Face atau dapat diuji langsung melalui platform build NVIDIA.
Sumber gambar: Shutterstock
Sumber: https://blockchain.news/news/nvidia-mistral-3-models-boost-ai-efficiency


