Cơ quan An ninh quốc gia Mỹ đang dùng mô hình Claude Mythos
Trang Axios tiết lộ Cơ quan An ninh quốc gia Mỹ (NSA) đang sử dụng mô hình trí tuệ nhân tạo Claude Mythos.
Thông tin trên xuất hiện vài ngày sau khi giám đốc điều hành Anthropic Dario Amodei, gặp gỡ Chánh văn phòng Nhà Trắng cùng vài quan chức khác, dường như để thảo luận về Mythos.
Nhà Trắng sau đó tuyên bố cuộc gặp hiệu quả và mang tính xây dựng, mặc dù Tổng thống Donald Trump nói rằng ông chẳng hề hay biết gì. Theo nguồn tin của Axios, NSA là một trong số khoảng 40 tổ chức mà Anthropic cho phép truy cập Claude Mythos. Cơ quan này đang sử dụng mô hình rất rộng rãi trong nội bộ.
Chưa rõ NSA sử dụng Claude Mythos như thế nào. Các tổ chức được cấp quyền truy cập thường dùng nó tìm kiếm lỗ hổng bảo mật mạng tiềm tàng. Cơ quan An ninh quốc gia Anh (MI5) cũng có thể dùng mô hình mới của Anthropic thông qua Viện An ninh AI.
Nguồn tin cũng cho biết thêm rằng tại cuộc gặp mới diễn ra, Anthropic cùng Nhà Trắng bàn luận khả năng cho nhiều bộ ngành ngoài NSA - trừ Lầu Năm Góc - dùng Claude Mythos.

Anthropic tạm hoãn phát hành rộng rãi Claude Mythos - Ảnh: NurPhoto via Getty Images.
“Quái vật AI” hay chiêu trò PR?
Anthropic giới thiệu Claude Mythos vào đầu tháng 4, nhưng lại tạm hoãn phát hành rộng rãi mô hình với lý do nó nguy hiểm đến mức đem lại mối đe dọa nghiêm trọng đối với an ninh phần mềm trên mọi hệ điều hành lẫn trình duyệt web chính.
Đây không chỉ là bản nâng cấp từ dòng Claude 3.5, mà ở cấp độ năng lực hoàn toàn mới. Trong các bài kiểm tra, mô hình tự xây dựng chuỗi tấn công nhiều bước để thoát khỏi môi trường máy tính bị giới hạn, truy cập Internet và gửi thư điện tử thông báo cho nhà nghiên cứu.
Đặc biệt theo tài liệu từ Anthropic, Claude Mythos đã phát hiện hàng nghìn lỗ hổng trên nhiều hệ điều hành, trình duyệt đến phần mềm mã nguồn mở. Trong số đó, có không ít lỗ hổng chưa từng được biết đến, chẳng hạn một lỗi tồn tại suốt 27 năm trong OpenBSD.
So với các mô hình trước đó có tỉ lệ thành công lúc thực hiện nhiệm vụ an ninh mạng gần như bằng 0%, Claude Mythos đạt tỷ lệ lên đến 72%.
Trước khả năng của mô hình mới, Anthropic phải khởi động dự án Glasswing hợp tác với loạt đơn vị lớn như Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks để vá số lỗ hổng mà Claude Mythos phát hiện.
Nếu những gì Anthropic tuyên bố về khả năng của mô hình mới là sự thật thì giới an ninh mạng sắp đối mặt mối nguy vô cùng lớn. AI có thể tìm thấy và khai thác nhiều lỗ hổng chưa từng được biết đến hơn trên hệ điều hành người dùng cuối, hệ thống máy chủ hay hệ thống cơ sở hạ tầng quan trọng. Chúng xác định chỉ cần qua gợi ý mà chẳng cần đến chuyên môn lập trình cấp cao.
Thông tin từ Anthropic nghe qua quả thực rất đáng sợ, nhưng giới chuyên gia cùng cộng đồng công nghệ vẫn đặt nghi vấn về động thái của công ty.
Việc công bố một mô hình cực mạnh nhưng lại từ chối phát hành rộng rãi là chiến thuật PR kinh điển nhằm tạo tiếng vang và nâng tầm vị thế. Làm vậy cũng dễ dẫn đến tình trạng “khan hiếm giả tạo” kích thích tâm lý tò mò của người dùng.
Hơn nữa, thay vì phát hành rộng rãi, Anthropic lại chỉ cấp quyền truy cập Claude Mythos cho 40 đơn vị hàng đầu thuộc dự án Glasswing – khiến nhiều người cho rằng đây là công cụ dành riêng cho giới tinh hoa.
Về mặt số liệu, con số hàng nghìn lỗ hổng không phải kết quả kiểm chứng trực tiếp mà được suy ra từ một tệp mẫu chỉ gồm 198 báo cáo đã trải qua đánh giá bởi con người.











