Claude lại gây chấn động
Mô hình AI mới Claude Mythos của Anthropic bị đánh giá quá nguy hiểm, chỉ hơn 40 công ty có quyền truy cập nhằm vá lỗ hổng bảo mật phần mềm toàn cầu.

Mô hình AI mới Anthropic có khả năng tìm ra mọi lỗ hổng bảo mật. Ảnh: Bloomberg.
Anthropic vừa công bố một mô hình AI mới có tên Claude Mythos Preview nhưng từ chối phát hành rộng rãi vì lo ngại nó có thể bị lạm dụng để tấn công cơ sở hạ tầng quan trọng. Thay vào đó, công ty cho phép hơn 40 đối tác công nghệ lớn gồm Apple, Amazon, Microsoft và Google tiếp cận mô hình nhằm tìm và vá lỗ hổng bảo mật phần mềm.
Liên minh này có tên Dự án Glasswing, bao gồm cả các nhà cung cấp phần cứng như Cisco và Broadcom, cùng Linux Foundation, tổ chức duy trì nhiều phần mềm mã nguồn mở quan trọng. Anthropic cam kết đóng góp tới 100 triệu USD dưới dạng tín dụng sử dụng Claude cho nỗ lực này.
Siêu mô hình AI mới
Điều khiến Claude Mythos Preview đặc biệt đáng lo ngại là khả năng tự động phát hiện lỗ hổng bảo mật zero-day, tức các lỗi trong phần mềm mà ngay cả nhà phát triển cũng chưa biết đến. Loại lỗ hổng này trước đây thường được tìm thấy khi chuyên gia bảo mật hàng đầu dành nhiều tháng nghiên cứu. Song, mô hình AI mới nhất của Anthropic có thể làm điều đó ở quy mô lớn, tự động và liên tục.

Claude Mythos khiến giới bảo mật sửng sốt. Ảnh: Bloomberg.
Theo Anthropic, Claude Mythos đã phát hiện hàng nghìn lỗi trong các hệ điều hành và trình duyệt phổ biến. Một trong số đó là lỗ hổng tồn tại suốt 27 năm trong OpenBSD, hệ điều hành mã nguồn mở được thiết kế chuyên biệt cho bảo mật và được tích hợp vào nhiều bộ định tuyến. Một lỗ hổng khác nằm trong một phần mềm video phổ biến mà các công cụ tự động đã quét đến 5 triệu lần mà không phát hiện được.
"Mô hình Claude Mythos tìm ra lỗ hổng mà giới nghiên cứu bảo mật trong nhiều thập kỷ cũng bỏ sót", Logan Graham, người đứng đầu nhóm thử nghiệm độ nguy hiểm của mô hình tại Anthropic cho biết.
Elia Zaitsev, Giám đốc công nghệ của CrowdStrike nhận định mô hình này mang đến rủi ro an ninh mạng toàn cầu.
"Những việc trước đây mất hàng tháng trời giờ chỉ mất vài phút nhờ AI", Zaitsev nói. Ông cũng cảnh báo rằng các đối thủ sẽ tìm cách khai thác những khả năng tương tự nhờ Claude Mythos.
Nguy cơ tiềm tàng
Nikesh Arora, CEO của Palo Alto Networks mô tả Claude Mythos mang theo hiểm họa khó lường.
"Hãy tưởng tượng nó giống như một đám đông đặc vụ đang liên tục và tỉ mỉ lập danh mục mọi điểm yếu trong cơ sở hạ tầng công nghệ của bạn", Nikesh Arora nhận định.
Jared Kaplan, Giám đốc khoa học Anthropic, giải thích khả năng bảo mật của Claude Mythos không phải kết quả huấn luyện đặc biệt. Nó là hệ quả tự nhiên từ việc mô hình giỏi lập trình và tự động sửa lỗi qua thời gian. Ông dự báo các mô hình AI khác sẽ sớm có khả năng tương tự. Khi đó, cuộc chạy đua giữa tin tặc và đội ngũ bảo mật sẽ leo thang ở cấp độ mới.

Claude Mythos có khả năng không được phát hành rộng rãi. Ảnh: Bloomberg.
Quyết định giữ lại mô hình bảo mật có tiền lệ từ năm 2019, khi OpenAI từ chối phát hành GPT-2 vì lo ngại nó có thể bị dùng để tự động hóa sản xuất thông tin sai lệch. Những người từng lãnh đạo dự án GPT-2 sau đó rời OpenAI và thành lập Anthropic.
Thông báo này được đưa ra một ngày sau khi Anthropic công bố doanh thu hàng năm dự kiến tăng hơn gấp 3 lần trong năm 2026, từ 9 tỷ USD lên hơn 30 tỷ USD. Phần lớn tăng trưởng đến từ nhu cầu dùng Claude như công cụ lập trình. Chính năng lực vượt trội đó cũng là thứ tạo ra mô hình có khả năng tìm lỗ hổng bảo mật theo cách chưa từng thấy trước đây.
Anthropic đang ở vị trí rất mâu thuẫn trong lĩnh vực AI hiện nay. Công ty vừa chạy đua phát triển các hệ thống mạnh mẽ để kiếm doanh thu, vừa phải liên tục cảnh báo về rủi ro của chính công nghệ mình tạo ra.
Nguồn Znews: https://znews.vn/anthropic-lai-gay-chan-dong-post1641929.html











