NVIDIA Melancarkan Titik Akses Berakselerasi GPU untuk Model Kimi K2.5 daripada Moonshot AI
Jessie A Ellis 4 Feb 2026, 20:11
NVIDIA kini menawarkan akses API berakselerasi GPU secara percuma kepada Kimi K2.5, sebuah model AI multimodal dengan 1 trilion parameter, dilengkapi 384 pakar dan panjang konteks sebanyak 262,000 token, khusus untuk para pembangun.
NVIDIA telah melancarkan titik akses berakselerasi GPU untuk Kimi K2.5 daripada Moonshot AI, memberikan para pembangun akses API percuma kepada salah satu model multimodal sumber terbuka yang paling canggih pada masa ini. Pengintegrasian ini, yang diumumkan pada 4 Februari 2026, memposisikan model dengan 1 trilion parameter tersebut untuk adopsi perusahaan yang lebih pantas melalui platform build.nvidia.com milik NVIDIA.
Kimi K2.5 membawa spesifikasi teknikal yang serius dan penting bagi pelaksanaan dalam skala produksi. Model ini menggunakan arkitektur Campuran Pakar dengan 384 pakar, yang hanya mengaktifkan 32.86 bilion parameter setiap token—menyamai kadar pengaktifan sebanyak 3.2%, sekali gus menjaga kos inferens agar tetap terkendali walaupun jumlah parameternya sangat besar. Panjang konteksnya mencecah 262,000 token, membolehkan pemprosesan analisis dokumen yang mendalam serta perbualan yang lebih panjang.
Kemampuan visuannya juga patut diberi perhatian. Moonshot telah membina Menara Visi MoonViT3d yang khusus untuk memproses imej dan bingkai video menjadi embebed, disokong oleh kamus 164,000 token yang merangkumi token khas untuk aplikasi visi. Ini bukan sekadar integrasi multimodal yang dipasang kemudian—sebaliknya, ia merupakan bahagian asli dalam arkitektur model tersebut.
Apakah yang Diperoleh Pembangun?
Akses prototaip percuma melalui Program Pembangun NVIDIA membolehkan pasukan menguji model terhadap beban kerja produksi sebelum menetapkan infrastruktur. API ini mengikut corak yang selaras dengan OpenAI, termasuk sokongan pemanggilan alat untuk aliran kerja agen. Perkhidmatan mikro NVIDIA NIM untuk inferens produksi berkontena bakal dilancarkan tidak lama lagi, namun tiada tarikh tepat yang dikemukakan.
Bagi pelaksanaan sendiri, integrasi vLLM kini sudah tersedia. NVIDIA juga mengesahkan sokongan penalaan semula melalui Framework NeMo sumber terbuka, dengan menggunakan NeMo AutoModel untuk menyesuaikan model secara langsung daripada semakan Hugging Face tanpa perlu langkah konversi.
Konteks Pasaran
Moonshot AI melancarkan Kimi K2.5 pada 27 Januari 2026, melatihnya menggunakan kira-kira 15 trilion token campuran visual dan teks yang dibina di atas asas K2 terdahulu. Model ini telah menarik perbandingan langsung dengan Gemini 3 Pro daripada Google, mencatatkan prestasi yang kompetitif termasuk skor 78.5% dalam ujian pemahaman visual MMMU-Pro dan 76.8% dalam SWE-Bench Verified untuk tugasan pengaturcaraan.
Satu ciri unik: mekanisme “Koloni Agen” yang menyelaraskan sehingga 100 sub-agen bersamaan, yang didakwa dapat mengurangkan masa eksekusi hingga 4.5 kali ganda berbanding pendekatan agen tunggal. Bagi perusahaan yang membina sistem autonomi yang kompleks, keupayaan ini membuka ruang yang signifikan dalam persaingan.
Sokongan arkitektur Blackwell oleh NVIDIA menunjukkan bahawa syarikat tersebut melihat Kimi K2.5 sebagai pesaing serius dalam pelaksanaan AI perusahaan. Para pembangun boleh mengakses model ini segera melalui build.nvidia.com atau melalui Platform API Kimi secara langsung dari Moonshot.
Sumber imej: Shutterstock- nvidia
- kimi k2.5
- moonshot ai
- ai multimodal
- komputasi gpu


