Claude Mythos Preview của Anthropic đã trở thành mô hình AI đầu tiên hoàn thành một cuộc tấn công mạng doanh nghiệp mô phỏng đầy đủ, theo đánh giá mới từ Viện An ninh AI (AISI) của Vương quốc Anh.
Những phát hiện này, được công bố vài ngày sau thông báo của mô hình vào ngày 7 tháng 4, cho thấy khả năng tấn công mạng của AI đã đạt đến mức đòi hỏi sự chú ý ngay lập tức từ các đội ngũ bảo mật trên toàn thế giới.
Claude Mythos là gì?
Anthropic đã công bố mô hình Claude Mythos Preview vào ngày 7 tháng 4, lựa chọn không phát hành rộng rãi cho công chúng. Thay vào đó, nhóm cấp quyền truy cập hạn chế cho các công ty nghiên cứu bảo mật để đánh giá và chuẩn bị cho các khả năng tiên tiến của nó.
Theo dõi chúng tôi trên X để nhận tin tức mới nhất ngay khi xảy ra
Sự phát triển này đã bắt đầu thu hút sự chú ý trên các giới công nghệ và thậm chí cả chính sách. Theo một báo cáo của Reuters trích dẫn các nguồn tin quen thuộc với vấn đề, Bộ trưởng Tài chính Hoa Kỳ Scott Bessent và Chủ tịch Cục Dự trữ Liên bang Jerome Powell đã tổ chức một cuộc họp khẩn cấp với các CEO ngân hàng lớn, cảnh báo về các rủi ro mạng tiềm ẩn liên quan đến mô hình này.
Claude Mythos Preview hoạt động như thế nào
Viện An ninh AI (AISI), một tổ chức nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ của chính phủ Vương quốc Anh, đã tiến hành đánh giá mạng của Claude Mythos Preview của Anthropic để kiểm tra khả năng an ninh mạng của nó.
Đầu tiên là các đánh giá capture-the-flag (CTF), nơi các hệ thống phải xác định và khai thác các lỗ hổng để lấy các "cờ" ẩn. Mythos đạt tỷ lệ thành công 73% trong các nhiệm vụ cấp chuyên gia. Điều này vẫn chưa được giải quyết bởi bất kỳ mô hình nào trước tháng 4 năm 2025.
Khả năng tấn công mạng của Claude Mythos. Nguồn: AISIHơn nữa, AISI đã xây dựng một mô phỏng tấn công mạng doanh nghiệp gồm 32 bước có tên "The Last Ones" (TLO). Các chuyên gia bảo mật con người sẽ cần khoảng 20 giờ để hoàn thành nó.
Mythos Preview đã hoàn thành toàn bộ mô phỏng trong 3 trên 10 lần thử. Trung bình, nó hoàn thành 22 trong số 32 bước tấn công. Claude Opus 4.6, người thực hiện tốt thứ hai, trung bình chỉ đạt 16 bước.
Kiểm tra red team của chính Anthropic phát hiện rằng Claude Mythos Preview có thể phát hiện và khai thác các lỗ hổng zero-day trên tất cả các hệ điều hành chính và trình duyệt web hàng đầu khi được người dùng chỉ dẫn rõ ràng.
AISI lưu ý rằng các tổ chức nên ưu tiên các biện pháp an ninh mạng cơ bản. Chúng bao gồm vá lỗi thường xuyên, kiểm soát truy cập nghiêm ngặt, tăng cường cấu hình bảo mật và ghi nhật ký toàn diện.
Đăng ký kênh YouTube của chúng tôi để xem các nhà lãnh đạo và nhà báo cung cấp những hiểu biết chuyên sâu
Bài viết Claude Mythos hoàn thành 73% các nhiệm vụ mạng chuyên gia mà không có AI nào có thể giải quyết trước đây xuất hiện đầu tiên trên BeInCrypto.
Nguồn: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/








