Claude Mythos Memecahkan 73% Tugas Siber Ahli yang Tidak Dapat Dipecahkan AI Sebelumnya

Claude Mythos Preview milik Anthropic telah menjadi model AI pertama yang menyelesaikan serangan jaringan korporat simulasi penuh, menurut evaluasi terbaru dari AI Security Institute (AISI) Inggris.

Temuan yang dipublikasikan beberapa hari setelah pengumuman model pada 7 April ini menunjukkan bahwa kemampuan siber AI telah mencapai tingkat yang membutuhkan perhatian segera dari tim keamanan di seluruh dunia.

Apa Itu Claude Mythos?

Anthropic meluncurkan model Claude Mythos Preview pada 7 April, memilih untuk tidak merilis secara luas ke publik. Tim ini justru memberikan akses terbatas kepada perusahaan riset keamanan untuk mengevaluasi dan mempersiapkan kemampuan canggihnya.

Ikuti kami di X untuk mendapatkan berita terbaru saat terjadi

Pengembangan ini telah mulai menarik perhatian di kalangan teknologi dan bahkan kebijakan. Menurut laporan Reuters yang mengutip sumber yang mengetahui masalah tersebut, Menteri Keuangan AS Scott Bessent dan Ketua Federal Reserve Jerome Powell mengadakan pertemuan mendesak dengan CEO bank-bank besar, memperingatkan tentang potensi risiko siber yang terkait dengan model ini.

Bagaimana Kinerja Claude Mythos Preview

AI Security Institute (AISI), sebuah organisasi riset dalam Departemen Sains, Inovasi, dan Teknologi pemerintah Inggris, melakukan evaluasi siber terhadap Claude Mythos Preview milik Anthropic untuk menguji kemampuan keamanan sibernya.

Pertama adalah evaluasi capture-the-flag (CTF), di mana sistem harus mengidentifikasi dan mengeksploitasi kerentanan untuk mengambil "bendera" tersembunyi. Mythos mencapai tingkat keberhasilan 73% pada tugas tingkat ahli. Ini tidak dapat dipecahkan oleh model mana pun sebelum April 2025.

Claude Mythos Cyber Attack Capabilities. Source: AISI

Selain itu, AISI membangun simulasi serangan jaringan korporat 32 langkah yang disebut "The Last Ones" (TLO). Profesional keamanan manusia memerlukan sekitar 20 jam untuk menyelesaikannya.

Mythos Preview menyelesaikan seluruh simulasi dalam 3 dari 10 percobaan. Rata-rata, ia menyelesaikan 22 dari 32 langkah serangan. Claude Opus 4.6, pelaku terbaik berikutnya, hanya rata-rata 16 langkah.

Pengujian red team Anthropic sendiri menemukan bahwa Claude Mythos Preview dapat mendeteksi dan mengeksploitasi kerentanan zero-day di semua sistem operasi utama dan browser web terkemuka ketika secara eksplisit diperintahkan oleh pengguna.

AISI mencatat bahwa organisasi harus memprioritaskan langkah-langkah keamanan siber dasar. Ini termasuk pembaruan rutin, kontrol akses ketat, penguatan konfigurasi keamanan, dan pencatatan komprehensif.

Berlangganan saluran YouTube kami untuk menonton para pemimpin dan jurnalis memberikan wawasan ahli

Postingan Claude Mythos Memecahkan 73% Tugas Siber Ahli yang Tidak Dapat Dipecahkan AI Sebelumnya pertama kali muncul di BeInCrypto.

Sumber: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/

Claude Mythos Memecahkan 73% Tugas Siber Ahli yang Tidak Dapat Dipecahkan AI Sebelumnya

Apa Itu Claude Mythos?

Bagaimana Kinerja Claude Mythos Preview

Anda Mungkin Juga Menyukai

Bukan celah hukum: Kontrol ekspor AI Singapura memungkinkan Tiongkok mengakses AI AS secara legal

Circle Mengakuisisi Hampir 1.000 Paten Blockchain IBM: Mengapa Penerbit USDC Memperluas Infrastruktur Keuangan On-Chain-nya?

Bunga Terbuka Hyperliquid Mencapai $11,5 Miliar: Apakah Perpetual On-Chain Meluas ke Pasar Ekuitas AS?

Berita yang Sedang Tren

Pembaruan Pagi NordFX — 10 Juli 2026

Neraca Perdagangan Jerman Melonjak ke €19,1 Miliar pada Mei, Secara Nyaman Melampaui Prakiraan

Arbitrum Mengumumkan Sepuluh Tim Inovatif — Dan Mengapa Ini Bukan Sekadar Hype

ARK Invest milik Cathie Wood Membeli Saham Circle Senilai $13,7 Juta Sambil Menjual Saham Robinhood

Wajah perawatan lansia yang berubah di Malaysia — Sayed Mohammad Reza Yamani Sayed Umar

Berita Live 24/7

Bacaan Cepat

Alternatif BitMart Terbaik 2026 Di mana Pedagang Altcoin Dapat Pergi Setelah Shutdown

Apakah Model Perbendaharaan Bitcoin Perusahaan Masih Berkelanjutan?

Mengapa Ethereum Mempertaruhkan Rekor Tertinggi saat Hasil Jatuh

Bagaimana Konflik Iran Mempengaruhi Saham Minyak dan Bitcoin di Seluruh Pasar

Mengapa Harga Bitcoin Bergerak Menjelang Keputusan Fed

Harga Kripto