Mistral merilis Leanstral, agen AI dengan 6 miliar parameter untuk verifikasi formal Lean 4, mengalahkan model yang lebih besar dengan biaya 1/15 di bawah lisensi Apache 2.0. (Baca SelengkapnyaMistral merilis Leanstral, agen AI dengan 6 miliar parameter untuk verifikasi formal Lean 4, mengalahkan model yang lebih besar dengan biaya 1/15 di bawah lisensi Apache 2.0. (Baca Selengkapnya

Mistral AI Meluncurkan Leanstral Agen Pembuktian Open-Source untuk Lean 4

2026/03/17 03:13
durasi baca 3 menit
Untuk memberikan masukan atau menyampaikan kekhawatiran terkait konten ini, silakan hubungi kami di [email protected]

Mistral AI Meluncurkan Agen Pembuktian Open-Source Leanstral untuk Lean 4

Zach Anderson 16 Mar 2026 19:13

Mistral merilis Leanstral, agen AI dengan parameter 6B untuk verifikasi formal Lean 4, mengalahkan model yang lebih besar dengan biaya 1/15 di bawah lisensi Apache 2.0.

Mistral AI Meluncurkan Agen Pembuktian Open-Source Leanstral untuk Lean 4

Mistral AI merilis Leanstral pada 16 Maret 2026—agen AI open-source pertama yang dibangun khusus untuk verifikasi formal Lean 4. Model dengan parameter 120B berjalan hanya dengan 6B parameter aktif dan dilengkapi dengan lisensi Apache 2.0, membuat pembuktian teorema tingkat produksi dapat diakses tanpa anggaran perusahaan.

Mengapa ini penting untuk kripto? Verifikasi formal—bukti matematis bahwa kode melakukan persis seperti yang diklaim—telah menjadi standar emas untuk mengamankan smart contract dan protokol blockchain. Bug dalam kode DeFi telah merugikan miliaran. Leanstral dapat secara dramatis menurunkan hambatan bagi proyek yang mencari keamanan terverifikasi.

Pertukaran Kinerja vs. Biaya

Mistral melakukan benchmark Leanstral terhadap kompetitor proprietary dan open-source menggunakan FLTEval, suite evaluasi baru yang menguji tugas rekayasa pembuktian nyata dari proyek formalisasi Teorema Terakhir Fermat.

Angka-angkanya mencolok. Leanstral pada pass@2 mencetak 26,3 poin dengan biaya komputasi $36. Claude Sonnet 4.6 berhasil 23,7 poin tetapi menghabiskan biaya $549—lebih dari 15x biaya untuk kinerja yang lebih buruk. Bahkan pada pass@16, di mana Leanstral mencapai 31,9 poin seharga $290, masih lebih murah dari seperlima harga Claude Opus 4.6 sebesar $1.650 (meskipun Opus memimpin kualitas pada 39,6).

Terhadap alternatif open-source, kesenjangan efisiensi semakin melebar. GLM5-744B-A40B dan Kimi-K2.5-1T-A32B stagnan di sekitar 16-20 poin meskipun memiliki parameter aktif 6-8x lebih banyak. Qwen3.5-397B-A17B membutuhkan empat percobaan untuk mencapai 25,4 poin—Leanstral mengalahkannya dengan dua percobaan.

Arsitektur Teknis

Leanstral menggunakan arsitektur mixture-of-experts yang jarang dioptimalkan untuk alur kerja rekayasa pembuktian. Model ini terintegrasi dengan protokol server bahasa Lean melalui MCP (Model Context Protocol), yang secara khusus dilatih untuk kinerja maksimal dengan tooling lean-lsp-mcp.

Lean 4 sendiri diluncurkan stabil pada September 2023 dan telah melihat adopsi cepat untuk formalisasi matematika. Pustaka Mathlib—koleksi besar bukti matematis—berhasil dipindahkan ke Lean 4 pada tahun yang sama. Proyek seperti bukti formal Teorema Terakhir Fermat mendemonstrasikan kemampuan platform untuk pekerjaan matematika yang serius.

Aplikasi Dunia Nyata

Mistral menampilkan Leanstral menangani pertanyaan debugging Stack Exchange asli tentang perubahan yang merusak di Lean 4.29.0-rc6. Agen mendiagnosis masalah kesetaraan definisional dengan alias tipe dan dengan benar mengidentifikasi bahwa menukar def dengan abbrev akan memulihkan pencocokan taktik.

Model ini juga mendemonstrasikan terjemahan lintas bahasa, mengonversi definisi Rocq (sebelumnya Coq) ke Lean 4 sambil mempertahankan semantik pembuktian dan mengimplementasikan notasi khusus.

Opsi Akses

Tiga jalur deployment tersedia: integrasi langsung di Mistral Vibe (gunakan /leanstall untuk memulai), endpoint API gratis di labs-leanstral-2603 untuk pengumpulan feedback waktu terbatas, atau deployment self-hosted dengan bobot Apache 2.0.

Untuk proyek blockchain, perhitungannya sederhana. Verifikasi formal secara tradisional memerlukan firma audit yang mahal atau keahlian internal yang mendalam. Agen open-source yang dapat membuktikan kebenaran kode dengan biaya $36-290 per tugas dapat mengubah cara protokol mendekati keamanan—dengan asumsi pembuktian bertahan dalam kondisi produksi.

Sumber gambar: Shutterstock
  • mistral ai
  • leanstral
  • lean 4
  • verifikasi formal
  • open source
Peluang Pasar
Logo 4
Harga 4(4)
$0.00806
$0.00806$0.00806
+4.13%
USD
Grafik Harga Live 4 (4)
Penafian: Artikel yang diterbitkan ulang di situs web ini bersumber dari platform publik dan disediakan hanya sebagai informasi. Artikel tersebut belum tentu mencerminkan pandangan MEXC. Seluruh hak cipta tetap dimiliki oleh penulis aslinya. Jika Anda meyakini bahwa ada konten yang melanggar hak pihak ketiga, silakan hubungi [email protected] agar konten tersebut dihapus. MEXC tidak menjamin keakuratan, kelengkapan, atau keaktualan konten dan tidak bertanggung jawab atas tindakan apa pun yang dilakukan berdasarkan informasi yang diberikan. Konten tersebut bukan merupakan saran keuangan, hukum, atau profesional lainnya, juga tidak boleh dianggap sebagai rekomendasi atau dukungan oleh MEXC.