Anthropic lộ hơn 512.000 dòng mã nguồn Claude Code, 'vạch áo' cho OpenAI, Google 'xem lưng'

Anthropic xác nhận bị lộ một phần mã nguồn nội bộ của Claude Code - trợ lý lập trình AI nổi tiếng do công ty phát triển.

“Không có dữ liệu khách hàng nhạy cảm hoặc thông tin đăng nhập nào bị ảnh hưởng hoặc bị lộ. Đây là sự cố trong quá trình đóng gói bản phát hành do lỗi con người, không phải là xâm phạm an ninh. Chúng tôi đang triển khai các biện pháp để ngăn chặn điều này xảy ra lần nữa”, người phát ngôn của Anthropic cho biết trong một tuyên bố.

Claude Code là công cụ lập trình sử dụng AI (trí tuệ nhân tạo) nổi tiếng của Anthropic. Hiểu đơn giản, đây là trợ lý viết mã bằng AI, giúp lập trình viên tạo mã nguồn, sửa lỗi, chạy lệnh, đọc/ghi file và tự động hóa các tác vụ kỹ thuật.

Việc rò rỉ mã nguồn là đòn giáng mạnh vào Anthropic, vì có thể giúp các nhà phát triển phần mềm và các đối thủ cạnh tranh hiểu rõ hơn về cách công ty khởi nghiệp này xây dựng Claude Code. Một bài đăng trên mạng xã hội X với liên kết đến mã nguồn Claude Code đã thu hút hơn 21 triệu lượt xem kể từ khi được chia sẻ lúc 15 giờ 23 ngày 31.3.

Vụ rò rỉ này cũng đánh dấu sai sót dữ liệu lớn thứ hai của Anthropic trong vòng chưa đầy một tuần. Mô tả về mô hình AI sắp ra mắt của Anthropic và các tài liệu khác gần đây đã được phát hiện trong một kho dữ liệu có thể truy cập công khai, trang Fortune đưa tin hôm 26.3.

Anthropic được thành lập vào năm 2021 bởi một nhóm các cựu lãnh đạo và nhà nghiên cứu OpenAI, nổi tiếng nhất với việc phát triển loạt mô hình AI Claude.

Công ty phát hành Claude Code vào tháng 5.2025, giúp các nhà phát triển phần mềm xây dựng tính năng, sửa lỗi và tự động hóa các tác vụ.

Trong năm qua, Claude Code đã được người dùng đón nhận rộng rãi, với mức độ sử dụng tăng mạnh. Tính đến tháng 2, doanh thu quy đổi hằng năm của Claude Code đã vượt mốc 2,5 tỉ USD.

Thành công của Claude Code thúc đẩy OpenAI, Google và xAI đầu tư nguồn lực vào việc phát triển các sản phẩm cạnh tranh.

Khoảng hơn 512.000 dòng mã nguồn của Claude Code đã bị lộ - Ảnh: Getty Images

Khoảng hơn 512.000 dòng mã nguồn của Claude Code đã bị lộ - Ảnh: Getty Images

Hơn 512.000 dòng mã nguồn Claude Code

Theo trang Axios, khoảng hơn 512.000 dòng mã nguồn của Claude Code đã bị lộ ra ngoài. Nguyên nhân không phải do hacker xâm nhập mà xuất phát từ lỗi kỹ thuật trong quá trình phát hành phần mềm. Cụ thể, một file gọi là source map (giúp lập trình viên dò lỗi) đã bị đưa nhầm vào bản phát hành và bị công khai trên nền tảng dành cho nhà phát triển.

Mã nguồn rò rỉ lại chứa nhiều chi tiết quan trọng về cách Anthropic xây dựng Claude Code.

Ngay sau khi bị phát hiện, đoạn mã này đã lan truyền nhanh chóng trên Internet. Các lập trình viên tải về, phân tích và thậm chí sao chép sang các kho mã nguồn công khai. Trong thời gian ngắn, một kho lưu trữ mã nguồn chứa mã Claude Code rò rỉ đã được sao chép hàng chục nghìn lần, cho thấy mức độ quan tâm cực lớn của cộng đồng.

Không chỉ dừng lại ở việc soi cấu trúc hệ thống, các nhà phát triển còn phát hiện nhiều tính năng Claude Code chưa từng được công bố. Trong đó có một cơ chế giống “thú ảo” tương tác với người dùng trong quá trình lập trình, cùng với một hệ thống AI có thể chạy nền liên tục để hỗ trợ công việc. Những chi tiết này hé lộ tham vọng của Anthropic trong việc biến Claude Code thành tác tử AI toàn diện, có khả năng tự động thực hiện nhiều tác vụ phức tạp.

Giới chuyên gia nhận định đây mới là điểm đáng lo ngại nhất với Anthropic. Việc lộ mã nguồn không chỉ là sự cố kỹ thuật, mà còn vô tình cung cấp cho đối thủ cái nhìn hiếm hoi về cách một sản phẩm AI trị giá hàng tỉ USD được xây dựng từ bên trong.

Trong bối cảnh Anthropic cạnh tranh khốc liệt với OpenAI, Google hay xAI, những thông tin như vậy có thể giúp đối thủ rút ngắn đáng kể thời gian nghiên cứu và phát triển sản phẩm cạnh tranh.

Đáng chú ý, đây không phải lần đầu Anthropic gặp sự cố liên quan đến rò rỉ thông tin. Tuần trước, một số tài liệu về các mô hình AI chưa ra mắt của Anthropic cũng bị phát hiện trong kho dữ liệu công khai. Điều này làm dấy lên lo ngại về quy trình kiểm soát nội bộ và an toàn dữ liệu tại một trong những công ty khởi nghiệp AI hàng đầu thế giới.

Dù vậy, một số người cho rằng tác động của vụ việc có thể không mang tính thảm họa ngay lập tức. Việc hiểu được mã nguồn không đồng nghĩa dễ dàng tái tạo toàn bộ hệ thống, đặc biệt với các sản phẩm AI phức tạp đòi hỏi hạ tầng và dữ liệu khổng lồ. Song về lâu dài, đây vẫn là một “vết xước” đáng kể với Anthropic, cả về uy tín lẫn lợi thế cạnh tranh.

Sự cố lần này cũng phản ánh một thực tế: Trong cuộc đua AI ngày càng khốc liệt, ngay cả những công ty hàng đầu cũng có thể mắc sai sót cơ bản. Đôi khi, chính những lỗi nhỏ như “đóng gói nhầm file” lại tạo ra tác động lớn trên toàn ngành.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/anthropic-lo-hon-512-000-dong-ma-nguon-claude-code-vach-ao-cho-openai-google-xem-lung-249554.html