Tội phạm mạng dùng Claude để vibe hacking, biến AI thành vũ khí nguy hiểm

Trí tuệ nhân tạo (AI) không chỉ giúp nhiều người tăng năng suất mà giờ đây còn hỗ trợ cả những tội phạm công nghệ cao.

Vibe hacking là thuật ngữ mới nổi, dùng để chỉ việc tội phạm mạng lạm dụng công cụ AI để thực hiện các cuộc tấn công mà không cần quá nhiều kiến thức chuyên sâu về kỹ thuật.

Cụm từ này bắt nguồn từ vibe coding (lập trình theo cảm hứng), phương pháp lập trình sử dụng AI để tạo ra mã một cách nhanh chóng chỉ bằng cách đưa ra các câu lệnh bằng ngôn ngữ tự nhiên. Vibe hacking áp dụng cách tiếp cận tương tự, nhưng với mục đích xấu.

Thay vì phải tự viết từng dòng mã độc, hacker chỉ cần "trò chuyện" với AI, mô tả mục tiêu và mong muốn của mình. AI sẽ tự động tạo ra các công cụ cần thiết, từ mã độc, mã hóa dữ liệu, cho đến các kịch bản tống tiền và thư rác.

Một ví dụ cụ thể mà công ty khởi nghiệp Anthropic đã chỉ ra là hacker đã sử dụng mô hình AI Claude để thực hiện toàn bộ quá trình tống tiền:

Trinh sát mục tiêu: Tìm kiếm thông tin về nạn nhân.

Tạo mã độc: Viết mã để đánh cắp dữ liệu hoặc mã hóa file.

Tự động hóa cuộc tấn công: Thực hiện các bước tấn công mà không cần can thiệp thủ công.

Tính toán tiền chuộc và tạo thông báo: Tạo ra các tin nhắn tống tiền mang tính đe dọa.

Nói tóm lại, vibe hacking cho phép tội phạm mạng với trình độ kỹ thuật thấp vẫn có thể thực hiện các cuộc tấn công phức tạp, biến AI từ công cụ sáng tạo thành vũ khí nguy hiểm.

Tội phạm dùng Claude để vibe hacking, thực hiện các cuộc tấn công mạng phức tạp mà không cần quá nhiều kiến thức chuyên sâu về kỹ thuật - Ảnh: Internet

Tội phạm dùng Claude để vibe hacking, thực hiện các cuộc tấn công mạng phức tạp mà không cần quá nhiều kiến thức chuyên sâu về kỹ thuật - Ảnh: Internet

Hôm 26.8, Anthropic cho biết đã phát hiện và ngăn chặn tội phạm mạng sử dụng mô hình AI Claude của công ty để cố gắng thực hiện các vụ tấn công.

Mô hình AI đã được dùng trong các hoạt động tấn công mạng từ nhiều năm nay. Tuy nhiên, Anthropic cho rằng sự phát triển vượt bậc của AI khiến công nghệ này có thể được sử dụng để thực hiện các vụ tấn công mạng trên toàn bộ quy trình với đội ngũ nhỏ hơn.

“AI có khả năng tự chủ đã bị vũ khí hóa”, công ty khởi nghiệp AI nổi tiếng này cho biết.

Bộ công cụ lập trình Claude của Anthropic đang được dùng rộng rãi trong giới công nghệ, gồm cả tại Meta Platforms.

Claude có thể giúp người mới học lập trình viết phần mềm với các câu lệnh đơn giản, hoặc giúp kỹ sư giàu kinh nghiệm làm việc hiệu quả hơn. Theo báo cáo của Anthropic, điều tương tự cũng đúng với tội phạm mạng.

Anthropic cho biết AI khiến hacker không còn cần trình độ kỹ thuật cao như trước vì họ có thể ra lệnh cho các công cụ như Claude tạo mã độc - hình thức mà công ty gọi là vibe hacking.

Trong một ví dụ, tội phạm mạng đã sử dụng Claude để “thực hiện hành vi trộm cắp và tống tiền bằng dữ liệu cá nhân trên diện rộng”, sau đó đe dọa nạn nhân phải trả tiền nếu không muốn dữ liệu bị rò rỉ. Theo Anthropic, tội phạm mạng đã dùng Claude để trinh sát mục tiêu, tự động hóa các cuộc tấn công, tính toán khoản tiền chuộc và tạo ra các “thông điệp tống tiền gây hoang mang về mặt hình ảnh”.

Trong một ví dụ khác, tội phạm mạng đã sử dụng Claude để phát triển ransomware - loại phần mềm độc hại mã hóa dữ liệu của nạn nhân và đòi tiền chuộc để mở khóa. Anthropic cho biết tội phạm đã rao bán gói ransomware trên các diễn đàn trực tuyến với giá lên tới 1.200 USD.

“Không có sự hỗ trợ từ Claude, hacker sẽ không thể triển khai hay sửa lỗi các thành phần cốt lõi của phần mềm độc hại”, Anthropic nói, đồng thời cho biết đã khóa tài khoản liên quan và báo cáo cho các bên có thẩm quyền.

Anthropic chia sẻ phát hiện trên để các nhà nghiên cứu và tổ chức khác có thể “tăng cường khả năng phòng thủ trước việc lạm dụng các mô hình AI”. Công ty khởi nghiệp AI được Amazon hậu thuẫn cho biết đã triển khai các phương pháp mới để phát hiện hành vi sử dụng sai mục đích công cụ AI của mình.

Những cải tiến của Claude Opus 4.1

Anthropic đang đàm phán để huy động khoảng 5 tỉ USD với mức định giá công ty 170 tỉ USD, trang Insider đưa tin hồi đầu tháng 8.

Hôm 7.8 vừa qua, Anthropic đã phát hành mô hình Claude Opus 4.1, bản nâng cấp quan trọng cho Opus 4, mang lại nhiều cải tiến về lập trình, khả năng suy luận, tích hợp và độ an toàn.

Hiệu suất lập trình của Claude Opus 4.1 được nâng cao rõ rệt. Claude Opus 4.1 đạt 74,5% trên bộ đánh giá SWE-bench Verified, vượt trội so với 72,5% của Opus 4. Mô hình AI mới cho phép chỉnh sửa mã trên nhiều file với độ chính xác cao hơn, giảm thiểu lỗi mới và tránh những thay đổi không cần thiết, nhờ đó cải thiện đáng kể hiệu quả làm việc của các kỹ sư phần mềm.

Về khả năng suy luận, Claude Opus 4.1 hỗ trợ tốt hơn các tác vụ phức tạp yêu cầu quản lý luồng công việc dài hạn, nghiên cứu độc lập và truy vấn dữ liệu sâu. Mô hình còn áp dụng phương pháp hybrid reasoning, kết hợp phản hồi nhanh và phân tích từng bước, cho phép người dùng kiểm soát ngân sách tính toán, tối ưu chi phí mà vẫn duy trì chất lượng phản hồi.

Khả năng xử lý ngữ cảnh cũng được mở rộng, với cửa sổ ngữ cảnh lên đến 200.000 token đầu vào và 32.000 token đầu ra, rất phù hợp cho các nhiệm vụ dài và phức tạp. Ngoài ra, Claude Opus 4.1 tương thích với nhiều nền tảng như Claude Pro/Max/Team/Enterprise, Claude Code, Amazon Bedrock, Google Cloud Vertex AI và GitHub Copilot, giúp doanh nghiệp dễ dàng triển khai trong các quy trình hiện có.

Về trải nghiệm thực tế, các kỹ sư từ Rakuten và Windsurf đánh giá Claude Opus 4.1 mang lại độ chính xác cao hơn đáng kể trong các tác vụ refactoring và debug hàng ngày, trong khi GitHub ghi nhận cải tiến rõ rệt về khả năng chỉnh sửa đa tệp so với bản trước.

Refactoring là quá trình tái cấu trúc mã nguồn mà không làm thay đổi chức năng bên ngoài. Mục tiêu của refactoring là làm cho mã dễ đọc hơn, gọn gàng hơn, dễ bảo trì hơn và có thể tối ưu hiệu suất.

Debug là quá trình tìm và sửa lỗi trong mã nguồn. Khi phần mềm hoạt động không đúng như mong đợi hoặc bị sự cố, lập trình viên sẽ dùng các công cụ và kỹ thuật debug để xác định nguyên nhân và sửa lỗi đó.

Cuối cùng, mức độ an toàn vẫn được duy trì như Opus 4. Claude Opus 4.1 có thể tự động kết thúc các cuộc hội thoại bị coi là cực đoan hoặc nguy hiểm nhằm bảo vệ cả người dùng lẫn hệ thống, nhưng vẫn tiếp tục hỗ trợ trong các trường hợp nhạy cảm như nguy cơ tự làm hại bản thân hoặc gây hại cho người khác.

Nhờ những cải tiến này, Claude Opus 4.1 trở thành lựa chọn tốt cho các dự án yêu cầu mô hình AI vừa thông minh, linh hoạt, vừa an toàn và dễ tích hợp trong môi trường thực tế.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/toi-pham-mang-dung-claude-de-vibe-hacking-bien-ai-thanh-vu-khi-nguy-hiem-236779.html