Cuộc chiến ngầm: Trí tuệ nhân tạo bị rút ruột theo quy mô công nghiệp

Thế giới công nghệ vừa trải qua cú sốc không kém gì những vụ rò rỉ dữ liệu thế kỷ. Đó là khi trí tuệ nhân tạo bị rút ruột theo quy mô công nghiệp.

Một mạng lưới botnet khổng lồ mang mật danh "Clockwork" bị phát hiện đang âm thầm thực hiện một chiến dịch tấn công chưa từng có tiền lệ nhắm vào Claude – mô hình ngôn ngữ lớn (LLM) niềm tự hào của Anthropic.

Khác với các cuộc tấn công từ chối dịch vụ (DDoS) truyền thống nhằm đánh sập hạ tầng máy chủ, mục tiêu của Clockwork thâm độc và tinh vi hơn gấp bội: nó không muốn "giết chết" vật chủ, mà muốn "hút cạn" tri thức.

Với 16 triệu lượt tương tác được điều phối nhịp nhàng từ hàng chục nghìn tài khoản giả mạo, đây không phải là trò đùa của những tay hacker nghiệp dư, mà là một chiến dịch "rút ruột" chất xám quy mô công nghiệp.

Sự kiện này, khi được đặt cạnh hồ sơ vụ án cựu kỹ sư Google đánh cắp tài liệu mật cho các công ty Trung Quốc vừa qua, đã phơi bày một góc khuất tàn khốc của cuộc đua AI toàn cầu. Đó là một thực tế lạnh lùng: Khi một quốc gia hay một tập đoàn không thể sáng tạo nhanh hơn đối thủ, con đường ngắn nhất để san lấp khoảng cách chính là đánh cắp bộ não của kẻ dẫn đầu.

Cuộc đại phẫu thuật số: 16 triệu nhát dao "cắt lớp" bộ não của Claude

Để hiểu được mức độ nghiêm trọng của vụ việc Clockwork, giới công nghệ cần nhìn nhận con số 16 triệu lượt tương tác không phải như một lưu lượng spam, mà là một mỏ vàng dữ liệu tinh khiết.

Trong thế giới huấn luyện AI, dữ liệu không còn là vua, mà là chúa tể. Nhưng không phải loại dữ liệu thô nào cũng có giá trị. Thứ mà các botnet này săn lùng là "Synthetic Data" (dữ liệu tổng hợp) chất lượng cao – những câu trả lời hoàn hảo, những đoạn mã code tối ưu và những suy luận logic chặt chẽ - được sinh ra từ một mô hình hàng đầu như Claude 3.

Cuộc đại phẫu thuật số với 16 triệu nhát dao "cắt lớp" bộ não của Claude

Cuộc đại phẫu thuật số với 16 triệu nhát dao "cắt lớp" bộ não của Claude

Những kẻ đứng sau Clockwork đã vận hành 24.000 tài khoản giả mạo như những "vòi bạch tuộc" kỹ thuật số. Chúng không hỏi những câu vô nghĩa. Ngược lại, chúng liên tục đưa ra các câu hỏi (prompt) hóc búa, phức tạp về toán học, lập trình và tư duy phản biện để ép Claude phải bộc lộ những suy luận tinh túy nhất.

Đây thực chất là một cuộc "đại phẫu thuật" nhằm cắt lớp bộ não của Claude. Bằng cách ghi lại hàng triệu cặp câu hỏi – đáp án, kẻ tấn công đang xây dựng một tập dữ liệu huấn luyện tinh chỉnh (SFT - Supervised Fine-Tuning) khổng lồ mà không tốn một xu chi phí nghiên cứu và phát triển (R&D).

Sự bất đối xứng về kinh tế ở đây là cực kỳ tàn khốc. Để tạo ra một mô hình thông minh như Claude, Anthropic đã phải huy động hàng tỉ USD vốn đầu tư, chi trả cho hàng chục nghìn GPU Nvidia H100 và hóa đơn tiền điện khổng lồ để chạy các cụm siêu máy tính trong nhiều tháng trời.

Ngược lại, kẻ tấn công chỉ mất chi phí thuê bao API rẻ mạt hoặc sử dụng các tài khoản dùng thử (free tier) để thu về khối tài sản trí tuệ trị giá hàng trăm triệu USD. Đây là hành vi "ký sinh" công nghệ điển hình: biến hạ tầng đắt đỏ của nạn nhân thành công cụ làm giàu cho chính mình.

Quy mô và sự tinh vi của botnet Clockwork cho thấy đây không thể là hành động tự phát của một cá nhân. Nó mang dáng dấp của một tổ chức thương mại lớn hoặc một chiến dịch được bảo trợ bởi nhà nước, nhằm xây dựng kho dữ liệu huấn luyện khổng lồ để "nuôi" các mô hình AI nội địa mà không cần trải qua quá trình thai nghén đau đớn.

Giải mã "Knowledge Distillation" (Chưng cất tri thức) – Kỹ thuật hắc ám hay con đường tắt của kẻ đến sau?

Vụ tấn công vào Claude đã đưa thuật ngữ "Knowledge Distillation" (Chưng cất tri thức) từ các phòng lab nghiên cứu ra ánh sáng của công luận, nhưng dưới một góc nhìn đen tối hơn.

Về mặt kỹ thuật, Knowledge Distillation là phương pháp nén mô hình, nơi một mô hình nhỏ (Student Model) được huấn luyện để bắt chước hành vi của một mô hình lớn hơn. Tuy nhiên, trong tay những kẻ đánh cắp tri thức, nó trở thành một kỹ thuật hắc ám để sao chép năng lực trí tuệ.

Tri thức đang được "rút" từ một mô hình lớn, uyên bác và truyền sang một mô hình đang học hỏi

Tri thức đang được "rút" từ một mô hình lớn, uyên bác và truyền sang một mô hình đang học hỏi

Hãy tưởng tượng Claude hay GPT-4 là những Giáo sư đại học uyên bác đã dành cả đời đọc hết sách vở trong thư viện nhân loại. Việc huấn luyện một mô hình tương tự từ đầu giống như việc bắt một đứa trẻ đọc lại toàn bộ thư viện đó – tốn kém, mất thời gian và đòi hỏi hạ tầng phần cứng khủng khiếp. Kẻ tấn công chọn con đường tắt: thay vì bắt "Học sinh" (mô hình của chúng) tự học, chúng bắt Học sinh copy y nguyên lời giải của Giáo sư.

Cơ chế "rút ruột" hoạt động như sau: Kẻ tấn công gửi hàng triệu prompt vào mô hình nạn nhân, thu thập câu trả lời và thậm chí cả các phân phối xác suất (logits) nếu có thể. Sau đó, chúng dùng chính dữ liệu đầu ra này để huấn luyện mô hình của mình.

Kết quả là mô hình "Học sinh" nhanh chóng học được cách suy luận, văn phong và kiến thức của Claude mà không cần sở hữu kiến thức nền tảng hay năng lực tính toán tương đương. Đây là lý do tại sao thời gian gần đây, thị trường xuất hiện nhan nhản các mô hình AI mã nguồn mở hoặc thương mại từ các quốc gia mới nổi được quảng cáo là có hiệu năng "ngang ngửa GPT-4" nhưng chi phí huấn luyện chỉ bằng một phần nhỏ.

Thực chất, đây là hành vi "rửa" chất xám. Chúng biến tài sản trí tuệ độc quyền của các công ty Mỹ thành sản phẩm giá rẻ để phá giá thị trường. Nguy hiểm hơn, kỹ thuật này tạo ra ảo giác về sự tiến bộ công nghệ.

Các mô hình "clone" này về bản chất không có khả năng sáng tạo thực sự; chúng chỉ là những chiếc gương phản chiếu lại tri thức của mô hình gốc. Nhưng trong cuộc đua thương mại khốc liệt, khi người dùng chỉ quan tâm đến kết quả cuối cùng, ranh giới giữa "học tập" và "ăn cắp" trở nên mong manh hơn bao giờ hết.

Các điều khoản sử dụng (ToS) của OpenAI hay Anthropic đều nghiêm cấm việc sử dụng đầu ra của họ để huấn luyện mô hình cạnh tranh, nhưng việc thực thi trong một thế giới ẩn danh là gần như vô vọng.

Từ "học lỏm" đến gián điệp công nghệ: Những bàn tay đen và bài học từ cựu kỹ sư Google

Nếu "Knowledge Distillation" là sự đánh cắp phần mềm tinh vi, thì vụ án của Linwei Ding (Đinh Lâm Vỹ) – cựu kỹ sư Google vừa bị bắt giữ – lại là minh chứng cho thấy sự tàn khốc của hoạt động gián điệp phần cứng. Đây là mảnh ghép cuối cùng để hoàn thiện bức tranh về chiến lược thâu tóm công nghệ AI toàn diện của Trung Quốc.

Linwei Ding không đánh cắp prompt hay câu trả lời của chatbot. Hắn đánh cắp "nhà máy" sản xuất ra chúng. Hồ sơ của Bộ Tư pháp Mỹ cáo buộc Ding đã bí mật tải xuống hơn 500 tệp tin chứa bí mật thương mại cốt lõi nhất của Google liên quan đến kiến trúc chip TPU v6 (Tensor Processing Unit) và phần mềm quản lý siêu máy tính.

TPU là vũ khí bí mật giúp Google huấn luyện các mô hình AI nhanh hơn và hiệu quả hơn so với việc dùng GPU Nvidia thông thường. Việc Trung Quốc, thông qua các điệp viên kinh tế, nhắm vào thiết kế chip và hệ thống quản lý trung tâm dữ liệu cho thấy tham vọng của họ không chỉ dừng lại ở việc sở hữu một con chatbot thông minh. Họ muốn làm chủ toàn bộ chuỗi giá trị, từ lớp vật lý bán dẫn đến lớp ứng dụng.

Dữ liệu mật về kiến trúc chip "TPU v6" cũng bị đánh cắp

Dữ liệu mật về kiến trúc chip "TPU v6" cũng bị đánh cắp

Xâu chuỗi hai sự kiện – vụ botnet Clockwork tấn công Claude và vụ gián điệp nội bộ tại Google – chúng ta thấy rõ một chiến lược "đi bằng hai chân" đầy toan tính của đối thủ. Một mặt, họ sử dụng kỹ thuật "Chưng cất tri thức" để sao chép nhanh chóng năng lực phần mềm và khả năng suy luận, giúp các công ty nội địa rút ngắn khoảng cách thuật toán với Mỹ. Mặt khác, họ sử dụng mạng lưới gián điệp cài cắm sâu để đánh cắp bí quyết phần cứng, nhằm giải quyết bài toán hóc búa nhất của Trung Quốc hiện nay: sự thiếu hụt năng lực tính toán do các lệnh cấm vận bán dẫn.

Vụ việc của Linwei Ding là một lời cảnh tỉnh đanh thép cho thung lũng Silicon. Trong nhiều thập kỷ, văn hóa mở và sự hợp tác khoa học không biên giới là động lực phát triển của công nghệ. Nhưng trong kỷ nguyên AI, khi mã nguồn và trọng số mô hình trở thành tài sản quốc gia, sự ngây thơ đó phải trả giá đắt.

Các tập đoàn công nghệ giờ đây buộc phải biến mình thành những pháo đài an ninh. Họ không chỉ phải chống lại các cuộc tấn công mạng từ bên ngoài như Clockwork, mà còn phải dè chừng những "con ngựa Troia" ngay trong lòng tổ chức.

Kết lại, những gì chúng ta đang chứng kiến không đơn thuần là những vụ vi phạm bản quyền hay tranh chấp thương mại. Đó là những phát súng trong một cuộc Chiến tranh Lạnh mới về công nghệ – cuộc chiến giành giật "linh hồn" của trí tuệ nhân tạo.

Trong cuộc đua zero-sum (tổng bằng không) này, ranh giới đạo đức đã bị xóa nhòa, và khái niệm "sáng tạo" đang bị thay thế bằng "chiếm đoạt" với tốc độ và quy mô chưa từng có trong lịch sử loài người.

Bùi Tú

Nguồn Một Thế Giới: https://1thegioi.vn/cuoc-chien-ngam-tri-tue-nhan-tao-bi-rut-ruot-theo-quy-mo-cong-nghiep-246716.html