Mistral AI Meluncurkan Agen Pembuktian Open-Source Leanstral untuk Lean 4
Zach Anderson 16 Mar 2026 19:13
Mistral merilis Leanstral, agen AI dengan parameter 6B untuk verifikasi formal Lean 4, mengalahkan model yang lebih besar dengan biaya 1/15 di bawah lisensi Apache 2.0.
Mistral AI merilis Leanstral pada 16 Maret 2026—agen AI open-source pertama yang dibangun khusus untuk verifikasi formal Lean 4. Model dengan parameter 120B berjalan hanya dengan 6B parameter aktif dan dilengkapi dengan lisensi Apache 2.0, membuat pembuktian teorema tingkat produksi dapat diakses tanpa anggaran perusahaan.
Mengapa ini penting untuk kripto? Verifikasi formal—bukti matematis bahwa kode melakukan persis seperti yang diklaim—telah menjadi standar emas untuk mengamankan smart contract dan protokol blockchain. Bug dalam kode DeFi telah merugikan miliaran. Leanstral dapat secara dramatis menurunkan hambatan bagi proyek yang mencari keamanan terverifikasi.
Pertukaran Kinerja vs. Biaya
Mistral melakukan benchmark Leanstral terhadap kompetitor proprietary dan open-source menggunakan FLTEval, suite evaluasi baru yang menguji tugas rekayasa pembuktian nyata dari proyek formalisasi Teorema Terakhir Fermat.
Angka-angkanya mencolok. Leanstral pada pass@2 mencetak 26,3 poin dengan biaya komputasi $36. Claude Sonnet 4.6 berhasil 23,7 poin tetapi menghabiskan biaya $549—lebih dari 15x biaya untuk kinerja yang lebih buruk. Bahkan pada pass@16, di mana Leanstral mencapai 31,9 poin seharga $290, masih lebih murah dari seperlima harga Claude Opus 4.6 sebesar $1.650 (meskipun Opus memimpin kualitas pada 39,6).
Terhadap alternatif open-source, kesenjangan efisiensi semakin melebar. GLM5-744B-A40B dan Kimi-K2.5-1T-A32B stagnan di sekitar 16-20 poin meskipun memiliki parameter aktif 6-8x lebih banyak. Qwen3.5-397B-A17B membutuhkan empat percobaan untuk mencapai 25,4 poin—Leanstral mengalahkannya dengan dua percobaan.
Arsitektur Teknis
Leanstral menggunakan arsitektur mixture-of-experts yang jarang dioptimalkan untuk alur kerja rekayasa pembuktian. Model ini terintegrasi dengan protokol server bahasa Lean melalui MCP (Model Context Protocol), yang secara khusus dilatih untuk kinerja maksimal dengan tooling lean-lsp-mcp.
Lean 4 sendiri diluncurkan stabil pada September 2023 dan telah melihat adopsi cepat untuk formalisasi matematika. Pustaka Mathlib—koleksi besar bukti matematis—berhasil dipindahkan ke Lean 4 pada tahun yang sama. Proyek seperti bukti formal Teorema Terakhir Fermat mendemonstrasikan kemampuan platform untuk pekerjaan matematika yang serius.
Aplikasi Dunia Nyata
Mistral menampilkan Leanstral menangani pertanyaan debugging Stack Exchange asli tentang perubahan yang merusak di Lean 4.29.0-rc6. Agen mendiagnosis masalah kesetaraan definisional dengan alias tipe dan dengan benar mengidentifikasi bahwa menukar def dengan abbrev akan memulihkan pencocokan taktik.
Model ini juga mendemonstrasikan terjemahan lintas bahasa, mengonversi definisi Rocq (sebelumnya Coq) ke Lean 4 sambil mempertahankan semantik pembuktian dan mengimplementasikan notasi khusus.
Opsi Akses
Tiga jalur deployment tersedia: integrasi langsung di Mistral Vibe (gunakan /leanstall untuk memulai), endpoint API gratis di labs-leanstral-2603 untuk pengumpulan feedback waktu terbatas, atau deployment self-hosted dengan bobot Apache 2.0.
Untuk proyek blockchain, perhitungannya sederhana. Verifikasi formal secara tradisional memerlukan firma audit yang mahal atau keahlian internal yang mendalam. Agen open-source yang dapat membuktikan kebenaran kode dengan biaya $36-290 per tugas dapat mengubah cara protokol mendekati keamanan—dengan asumsi pembuktian bertahan dalam kondisi produksi.
Sumber gambar: Shutterstock- mistral ai
- leanstral
- lean 4
- verifikasi formal
- open source


