Claude Mythos Preview dari Anthropic menjadi model AI pertama yang berhasil menyelesaikan simulasi serangan jaringan korporasi secara penuh, menurut evaluasi baClaude Mythos Preview dari Anthropic menjadi model AI pertama yang berhasil menyelesaikan simulasi serangan jaringan korporasi secara penuh, menurut evaluasi ba

Claude Mythos Sukses Pecahkan 73% Tugas Siber Ahli yang Sebelumnya Tak Bisa Diselesaikan AI

2026/04/14 18:25
durasi baca 2 menit
Untuk memberikan masukan atau menyampaikan kekhawatiran terkait konten ini, silakan hubungi kami di [email protected]

Claude Mythos Preview dari Anthropic menjadi model AI pertama yang berhasil menyelesaikan simulasi serangan jaringan korporasi secara penuh, menurut evaluasi baru dari AI Security Institute (AISI) Inggris.

Penemuan ini, yang dipublikasikan beberapa hari setelah pengumuman model pada 7 April, menunjukkan bahwa kemampuan siber AI telah mencapai tingkat yang membutuhkan perhatian segera dari tim keamanan di seluruh dunia.

Apa Itu Claude Mythos?

Anthropic meluncurkan model Claude Mythos Preview pada 7 April dan memilih untuk tidak merilisnya secara luas ke publik. Tim Anthropic hanya memberikan akses terbatas kepada perusahaan riset keamanan agar mereka dapat mengevaluasi sekaligus mempersiapkan diri terhadap kemampuan canggih AI ini.

Follow kami di X agar selalu mendapatkan berita terbaru secara real-time

Perkembangan ini sudah mulai menarik perhatian di kalangan teknologi bahkan di dunia kebijakan. Menurut laporan Reuters yang mengutip sumber yang mengetahui masalah ini, Menteri Keuangan AS Scott Bessent dan Ketua The Fed Jerome Powell mengadakan pertemuan darurat bersama para CEO bank besar dan memperingatkan tentang risiko siber yang mungkin terkait dengan model AI tersebut.

Bagaimana Performa Claude Mythos Preview

AI Security Institute (AISI), organisasi riset yang berada di bawah Department for Science, Innovation and Technology pemerintah Inggris, melakukan evaluasi siber pada Claude Mythos Preview Anthropic untuk menguji kemampuan keamanannya.

Pengujian pertama adalah capture-the-flag (CTF), di mana sistem harus menemukan dan mengeksploitasi celah keamanan demi mendapatkan “flag” tersembunyi. Mythos meraih tingkat keberhasilan 73% pada tugas tingkat ahli, yang sebelumnya belum pernah dicapai model lain hingga April 2025.

Kemampuan Serangan Siber Claude MythosKemampuan Serangan Siber Claude Mythos | Sumber: AISI

Selain itu, AISI membuat simulasi serangan jaringan korporasi 32-langkah bernama “The Last Ones” (TLO). Profesional keamanan siber manusia memerlukan waktu sekitar 20 jam untuk menyelesaikannya.

Mythos Preview berhasil menyelesaikan seluruh simulasi ini pada 3 dari 10 percobaan. Rata-rata, AI ini mampu menyelesaikan 22 dari 32 langkah serangan. Sementara Claude Opus 4.6, AI terbaik berikutnya, hanya mencapai rata-rata 16 langkah.

Pengujian internal red team Anthropic juga mengungkap Claude Mythos Preview dapat mendeteksi dan mengeksploitasi celah zero-day di seluruh sistem operasi utama dan browser web terpopuler jika pengguna memberikan perintah khusus.

AISI menekankan bahwa organisasi harus memprioritaskan langkah dasar keamanan siber. Ini meliputi patching rutin, kontrol akses ketat, penguatan konfigurasi keamanan, dan pencatatan aktivitas secara menyeluruh.

Langganan ke YouTube kami untuk menonton pemimpin industri dan jurnalis berbagi wawasan ahli

Peluang Pasar
Logo INI
Harga INI(INI)
$0.10235
$0.10235$0.10235
+0.30%
USD
Grafik Harga Live INI (INI)
Penafian: Artikel yang diterbitkan ulang di situs web ini bersumber dari platform publik dan disediakan hanya sebagai informasi. Artikel tersebut belum tentu mencerminkan pandangan MEXC. Seluruh hak cipta tetap dimiliki oleh penulis aslinya. Jika Anda meyakini bahwa ada konten yang melanggar hak pihak ketiga, silakan hubungi [email protected] agar konten tersebut dihapus. MEXC tidak menjamin keakuratan, kelengkapan, atau keaktualan konten dan tidak bertanggung jawab atas tindakan apa pun yang dilakukan berdasarkan informasi yang diberikan. Konten tersebut bukan merupakan saran keuangan, hukum, atau profesional lainnya, juga tidak boleh dianggap sebagai rekomendasi atau dukungan oleh MEXC.

USD1 Genesis: 0 Biaya + 12% APR

USD1 Genesis: 0 Biaya + 12% APRUSD1 Genesis: 0 Biaya + 12% APR

Pengguna baru: stake hingga 600% APR Waktu terbatas!