Claude Mythos Preview milik Anthropic telah menjadi model AI pertama yang menyelesaikan serangan jaringan korporat simulasi penuh, menurut evaluasi terbaru dari AI Security Institute (AISI) Inggris.
Temuan yang dipublikasikan beberapa hari setelah pengumuman model pada 7 April ini menunjukkan bahwa kemampuan siber AI telah mencapai tingkat yang membutuhkan perhatian segera dari tim keamanan di seluruh dunia.
Apa Itu Claude Mythos?
Anthropic meluncurkan model Claude Mythos Preview pada 7 April, memilih untuk tidak merilis secara luas ke publik. Tim ini justru memberikan akses terbatas kepada perusahaan riset keamanan untuk mengevaluasi dan mempersiapkan kemampuan canggihnya.
Ikuti kami di X untuk mendapatkan berita terbaru saat terjadi
Pengembangan ini telah mulai menarik perhatian di kalangan teknologi dan bahkan kebijakan. Menurut laporan Reuters yang mengutip sumber yang mengetahui masalah tersebut, Menteri Keuangan AS Scott Bessent dan Ketua Federal Reserve Jerome Powell mengadakan pertemuan mendesak dengan CEO bank-bank besar, memperingatkan tentang potensi risiko siber yang terkait dengan model ini.
Bagaimana Kinerja Claude Mythos Preview
AI Security Institute (AISI), sebuah organisasi riset dalam Departemen Sains, Inovasi, dan Teknologi pemerintah Inggris, melakukan evaluasi siber terhadap Claude Mythos Preview milik Anthropic untuk menguji kemampuan keamanan sibernya.
Pertama adalah evaluasi capture-the-flag (CTF), di mana sistem harus mengidentifikasi dan mengeksploitasi kerentanan untuk mengambil "bendera" tersembunyi. Mythos mencapai tingkat keberhasilan 73% pada tugas tingkat ahli. Ini tidak dapat dipecahkan oleh model mana pun sebelum April 2025.
Claude Mythos Cyber Attack Capabilities. Source: AISISelain itu, AISI membangun simulasi serangan jaringan korporat 32 langkah yang disebut "The Last Ones" (TLO). Profesional keamanan manusia memerlukan sekitar 20 jam untuk menyelesaikannya.
Mythos Preview menyelesaikan seluruh simulasi dalam 3 dari 10 percobaan. Rata-rata, ia menyelesaikan 22 dari 32 langkah serangan. Claude Opus 4.6, pelaku terbaik berikutnya, hanya rata-rata 16 langkah.
Pengujian red team Anthropic sendiri menemukan bahwa Claude Mythos Preview dapat mendeteksi dan mengeksploitasi kerentanan zero-day di semua sistem operasi utama dan browser web terkemuka ketika secara eksplisit diperintahkan oleh pengguna.
AISI mencatat bahwa organisasi harus memprioritaskan langkah-langkah keamanan siber dasar. Ini termasuk pembaruan rutin, kontrol akses ketat, penguatan konfigurasi keamanan, dan pencatatan komprehensif.
Berlangganan saluran YouTube kami untuk menonton para pemimpin dan jurnalis memberikan wawasan ahli
Postingan Claude Mythos Memecahkan 73% Tugas Siber Ahli yang Tidak Dapat Dipecahkan AI Sebelumnya pertama kali muncul di BeInCrypto.
Sumber: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/








