Claude Mythos Phá Vỡ 73% Nhiệm Vụ An Ninh Mạng Cấp Chuyên Gia Mà Không AI Nào Có Thể Giải Quyết Trước Đây

Claude Mythos Preview của Anthropic đã trở thành mô hình AI đầu tiên hoàn thành một cuộc tấn công mạng doanh nghiệp mô phỏng đầy đủ, theo đánh giá mới từ Viện An ninh AI (AISI) của Vương quốc Anh.

Những phát hiện này, được công bố vài ngày sau thông báo của mô hình vào ngày 7 tháng 4, cho thấy khả năng tấn công mạng của AI đã đạt đến mức đòi hỏi sự chú ý ngay lập tức từ các đội ngũ bảo mật trên toàn thế giới.

Claude Mythos là gì?

Anthropic đã công bố mô hình Claude Mythos Preview vào ngày 7 tháng 4, lựa chọn không phát hành rộng rãi cho công chúng. Thay vào đó, nhóm cấp quyền truy cập hạn chế cho các công ty nghiên cứu bảo mật để đánh giá và chuẩn bị cho các khả năng tiên tiến của nó.

Theo dõi chúng tôi trên X để nhận tin tức mới nhất ngay khi xảy ra

Sự phát triển này đã bắt đầu thu hút sự chú ý trên các giới công nghệ và thậm chí cả chính sách. Theo một báo cáo của Reuters trích dẫn các nguồn tin quen thuộc với vấn đề, Bộ trưởng Tài chính Hoa Kỳ Scott Bessent và Chủ tịch Cục Dự trữ Liên bang Jerome Powell đã tổ chức một cuộc họp khẩn cấp với các CEO ngân hàng lớn, cảnh báo về các rủi ro mạng tiềm ẩn liên quan đến mô hình này.

Claude Mythos Preview hoạt động như thế nào

Viện An ninh AI (AISI), một tổ chức nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ của chính phủ Vương quốc Anh, đã tiến hành đánh giá mạng của Claude Mythos Preview của Anthropic để kiểm tra khả năng an ninh mạng của nó.

Đầu tiên là các đánh giá capture-the-flag (CTF), nơi các hệ thống phải xác định và khai thác các lỗ hổng để lấy các "cờ" ẩn. Mythos đạt tỷ lệ thành công 73% trong các nhiệm vụ cấp chuyên gia. Điều này vẫn chưa được giải quyết bởi bất kỳ mô hình nào trước tháng 4 năm 2025.

Khả năng tấn công mạng của Claude Mythos. Nguồn: AISI

Hơn nữa, AISI đã xây dựng một mô phỏng tấn công mạng doanh nghiệp gồm 32 bước có tên "The Last Ones" (TLO). Các chuyên gia bảo mật con người sẽ cần khoảng 20 giờ để hoàn thành nó.

Mythos Preview đã hoàn thành toàn bộ mô phỏng trong 3 trên 10 lần thử. Trung bình, nó hoàn thành 22 trong số 32 bước tấn công. Claude Opus 4.6, người thực hiện tốt thứ hai, trung bình chỉ đạt 16 bước.

Kiểm tra red team của chính Anthropic phát hiện rằng Claude Mythos Preview có thể phát hiện và khai thác các lỗ hổng zero-day trên tất cả các hệ điều hành chính và trình duyệt web hàng đầu khi được người dùng chỉ dẫn rõ ràng.

AISI lưu ý rằng các tổ chức nên ưu tiên các biện pháp an ninh mạng cơ bản. Chúng bao gồm vá lỗi thường xuyên, kiểm soát truy cập nghiêm ngặt, tăng cường cấu hình bảo mật và ghi nhật ký toàn diện.

Đăng ký kênh YouTube của chúng tôi để xem các nhà lãnh đạo và nhà báo cung cấp những hiểu biết chuyên sâu

Bài viết Claude Mythos hoàn thành 73% các nhiệm vụ mạng chuyên gia mà không có AI nào có thể giải quyết trước đây xuất hiện đầu tiên trên BeInCrypto.

Nguồn: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/

Claude Mythos Phá Vỡ 73% Nhiệm Vụ An Ninh Mạng Cấp Chuyên Gia Mà Không AI Nào Có Thể Giải Quyết Trước Đây

Claude Mythos là gì?

Claude Mythos Preview hoạt động như thế nào

Có thể bạn cũng thích

Ngoại hối châu Á: MAS thắt chặt và các điểm nghẽn chiến lược – Rabobank

Binance Wallet perps ra mắt khi dòng chảy BNB on-chain và các động thái của cá voi Binance Life bị giám sát chặt chẽ

280 triệu USD bị rút cạn thông qua thủ đoạn lừa đảo xã hội

Tin tức xu hướng

Ngân hàng Saudi dễ bị tổn thương trước hậu quả của cuộc chiến kéo dài

BÁO CÁO | Các Vụ Tấn Công Web3 Gây Thiệt Hại Hơn 480 Triệu USD Trong Quý 1 Năm 2026 Do Các Cuộc Tấn Công Kỹ Thuật Xã Hội, Theo Hacken

Bitcoin chạm mốc 76.000 USD sau khi lạm phát PPI của Mỹ ổn định: Liệu BTC có giữ được mức tăng?

Thị trường Forex(FX) châu Á đối mặt với bài kiểm tra quan trọng: MAS thắt chặt và các điểm nghẽn chiến lược định hình lại động lực tiền tệ khu vực

Bitcoin Kiểm Tra Mức Giá Gốc ETF Chính: Nhưng Phe Giá Xuống Vẫn Chưa Dừng Lại

Tin tức trực tiếp 24/7

Đọc nhanh

Tại sao hàng triệu người sử dụng tiền điện tử để thanh toán cho (Không phải như bạn nghĩ)

Trả tiền cho Pornhub ẩn danh bằng tiền điện tử năm 2026: Hướng dẫn đủ

BEEG sống và chết với Sui - Đây là ý nghĩa của bạn

Tín hiệu đảo chiều AAVE nhấp nháy: Liệu khoản thu hồi 100 đô la cuối cùng đã gần đến?

Phân tích mã thông báo BEEG 2026: Cơ hội hay cường điệu sau sự cố 98%?

Giá tiền mã hoá