Chuyên gia: Các mô hình AI Trung Quốc tiến bộ nhanh chóng nhờ sao chép sản phẩm Mỹ

4 giờ trước Gốc

Cuộc đua AI bước vào giai đoạn mới đầy tranh cãi, khi hai công ty khởi nghiệp AI hàng đầu Mỹ cáo buộc đối thủ Trung Quốc dùng kỹ thuật chưng cất để sao chép năng lực từ những mô hình tiên tiến.

Từ cáo buộc ban đầu của OpenAI vào đầu năm 2025 liên quan đến mô hình DeepSeek R1 đến cảnh báo đầu tháng 2 từ “cha đẻ ChatGPT” và báo cáo chi tiết của Anthropic mới đây, những diễn biến này phơi bày vùng xám trong huấn luyện AI (trí tuệ nhân tạo). Các mô hình AI không chỉ được phát triển bằng cách huấn luyện từ đầu mà còn có thể được học ngược từ chính đối thủ.

Các chuyên gia nhận định đây không chỉ là tranh chấp thương mại, mà có thể định hình lại cuộc cạnh tranh AI toàn cầu những năm tới.

DeepSeek R1 gây sốt và cáo buộc ban đầu từ OpenAI

Cuộc tranh cãi bắt đầu vào tháng 1.2025 khi công ty khởi nghiệp AI DeepSeek (Trung Quốc) gây chấn động ngành công nghệ với việc ra mắt mô hình suy luận R1 có hiệu năng tương đương các sản phẩm hàng đầu Mỹ như của OpenAI, Anthropic và Google, nhưng chi phí huấn luyện thấp hơn rất nhiều.

Động thái này đã làm dấy lên lo ngại tại Mỹ rằng Trung Quốc có thể bắt kịp trong cuộc đua AI bất chấp việc bị hạn chế mua chip hiệu năng cao từ Nvidia.

Sự xuất hiện của R1 góp phần đã kích hoạt đợt bán tháo cổ phiếu công nghệ trị giá khoảng 1.000 tỉ USD trên thị trường toàn cầu. Riêng Nvidia, công ty Mỹ chuyên cung cấp chip tiên tiến đắt đỏ để huấn luyện các mô hình AI, mất gần 600 tỉ USD vốn hóa thị trường chỉ trong một ngày 27.1.2025.

Không lâu sau đó, OpenAI cáo buộc DeepSeek đã sử dụng kỹ thuật chưng cất mô hình AI của họ để xây dựng R1. Chưng cất là phương pháp trong đó một mô hình AI nhỏ hơn học từ đầu ra của mô hình lớn hơn, giúp tiết kiệm đáng kể chi phí và thời gian phát triển.

Về bản chất, kỹ thuật này là hợp pháp nếu được sử dụng nội bộ. Tuy nhiên, vấn đề trở nên nghiêm trọng nếu một công ty sử dụng đầu ra của mô hình đối thủ để huấn luyện sản phẩm cạnh tranh.

OpenAI và Anthropic cáo buộc các công ty Trung Quốc sử dụng kỹ thuật chưng cất để sao chép năng lực từ những mô hình AI tiên tiến - Ảnh: MTG

OpenAI cảnh báo DeepSeek tiếp tục nhắm vào các công ty AI Mỹ

Đầu tháng 2 vừa qua, OpenAI cho biết trong một bản ghi nhớ gửi Ủy ban đặc biệt của Hạ viện Mỹ về Trung Quốc rằng DeepSeek đã sử dụng kỹ thuật chưng cất liên quan đến các sản phẩm của Mỹ để huấn luyện mô hình thế hệ tiếp theo.

Trong bản ghi nhớ gửi, OpenAI cho biết: “Chúng tôi đã quan sát thấy các tài khoản liên quan đến nhân viên DeepSeek phát triển các phương thức nhằm vượt qua các hạn chế của OpenAI và truy cập các mô hình thông qua các bộ định tuyến bên thứ ba được che giấu nguồn gốc, cùng những cách khác nhằm ẩn danh nguồn truy cập”.

“Chúng tôi cũng biết rằng nhân viên DeepSeek đã phát triển mã để truy cập các mô hình AI của Mỹ và thu thập đầu ra phục vụ cho quá trình chưng cất theo cách lập trình tự động”, trích bản ghi nhớ.

Theo OpenAI, hoạt động chưng cất, phần lớn liên quan đến Trung Quốc và đôi khi là Nga, vẫn tiếp diễn và ngày càng tinh vi bất chấp các nỗ lực trấn áp những người dùng vi phạm điều khoản dịch vụ của hãng. Công ty khởi nghiệp AI hàng đầu thế giới cho biết đã quan sát thấy các hoạt động này trực tiếp trên nền tảng của mình.

Sự phổ biến của phương pháp chưng cất có thể trở thành mối đe dọa kinh doanh với các công ty Mỹ như OpenAI và Anthropic - vốn đã đầu tư hàng tỉ USD vào hạ tầng AI và thu phí các dịch vụ cao cấp. Hành vi chưng cất mô hình có thể làm suy giảm lợi thế mà Mỹ đang có trước Trung Quốc trong lĩnh vực AI.

OpenAI cũng nhấn mạnh các rủi ro an ninh quốc gia khác liên quan đến bước tiến của DeepSeek, gồm cả việc chatbot thuộc công ty này kiểm duyệt kết quả về những chủ đề bị chính phủ Trung Quốc coi là nhạy cảm. Theo OpenAI, khi các khả năng được sao chép thông qua chưng cất, các biện pháp bảo vệ thường bị bỏ qua, làm gia tăng nguy cơ các mô hình AI bị lạm dụng trong những lĩnh vực rủi ro cao như sinh học hoặc hóa học.

Nếu cáo buộc đầu năm 2025 liên quan đến một mô hình cụ thể, cảnh báo hồi tháng 2.2026 từ OpenAI cho thấy chưng cất có thể là chiến lược dài hạn của DeepSeek.

Anthropic công bố thông tin chi tiết: 24.000 tài khoản giả và 16 triệu truy vấn

Cuộc tranh cãi lên đến đỉnh điểm vào ngày 23.2 vừa qua khi Anthropic công bố báo cáo chi tiết cáo buộc DeepSeek, Moonshot AI và MiniMax đã tiến hành các chiến dịch chưng cất quy mô công nghiệp nhằm trích xuất năng lực từ mô hình Claude của họ.

Theo Anthropic, ba công ty AI Trung Quốc này đã tạo khoảng 24.000 tài khoản giả và thực hiện hơn 16 triệu tương tác với Claude, vi phạm điều khoản dịch vụ và hạn chế truy cập theo khu vực.

Anthropic cho biết mục tiêu của các chiến dịch này là trích xuất các khả năng cốt lõi của Claude, gồm suy luận logic, lập trình, sử dụng công cụ tự động, phân tích dữ liệu và giải quyết vấn đề phức tạp.

Anthropic tiết lộ DeepSeek đã tạo ra hơn 150.000 cuộc hội thoại tập trung vào khả năng suy luận của Claude, trong khi Moonshot AI và MiniMax lần lượt tạo ra khoảng 3,4 triệu và 13 triệu cuộc hội thoại, nhắm vào lập trình và các chức năng khác.

Anthropic: DeepSeek, MiniMax và Moonshot AI đã tạo khoảng 24.000 tài khoản giả và thực hiện hơn 16 triệu tương tác với Claude - Ảnh: MTG

Chưng cất: Công cụ phát triển hay sao chép mô hình AI?

Khái niệm chưng cất AI đã tồn tại từ lâu. Năm 2015, ba nhà nghiên cứu, trong đó có Geoffrey Hinton - nhà khoa học được mệnh danh là “cha đẻ AI” - công bố bài viết có tiêu đề Distilling the Knowledge in a Neural Network (Chưng cất tri thức trong mạng nơ-ron), cho thấy cách tri thức từ mô hình AI lớn có thể được chuyển sang mô hình nhỏ hơn, dễ triển khai hơn.

Trong nhiều năm, các công ty AI đã sử dụng phương pháp này để tạo ra các phiên bản nhỏ hơn và hiệu quả hơn của mô hình lớn. Song, vấn đề nằm ở chỗ chưng cất có thể được sử dụng để sao chép năng lực từ các mô hình đối thủ mà không cần mức đầu tư tương đương.

Anthropic cảnh báo kỹ thuật này có thể cho phép các công ty nhanh chóng tái tạo các năng lực mà đối thủ đã mất nhiều năm và hàng tỉ USD để phát triển.

Lý do giúp các mô hình AI Trung Quốc tiến bộ nhanh chóng

Dmitri Alperovitch - Chủ tịch viện nghiên cứu Silverado Policy Accelerator và đồng sáng lập hãng an ninh mạng CrowdStrike (Mỹ) - nói với trang TechCrunch rằng ông không ngạc nhiên khi biết điều này.

“Trong một thời gian khá dài, rõ ràng rằng một phần lý do giúp các mô hình AI Trung Quốc tiến bộ nhanh chóng là nhờ hành vi đánh cắp thông qua kỹ thuật chưng cất từ mô hình AI tiên tiến của Mỹ. Giờ đây, chúng ta đã có bằng chứng xác thực về điều đó. Điều này càng cho chúng ta thêm lý do thuyết phục để từ chối bán bất kỳ chip AI nào cho các công ty này, vì điều đó chỉ càng mang lại lợi thế cho họ”, Dmitri Alperovitch bình luận.

Huan Sun - phó giáo sư khoa học máy tính và kỹ thuật tại Đại học Bang Ohio (Mỹ) - bình luận: “Tôi không thể nghĩ ra cách nào khác để các tác giả có thể chứng minh rằng họ không chưng cất từ GPT của OpenAI”.

Tháng trước, một cuộc thảo luận trên diễn đàn Reddit (Mỹ) đã diễn ra sau khi Moonshot AI phát hành mô hình mới nhất Kimi K2.5. Moonshot AI được hỏi liệu Kimi K2.5 có “chưng cất nhiều” từ Claude của Anthropic hay không, sau khi mô hình AI này đôi khi tự nhận mình là Claude.

Yang Zhilin - nhà sáng lập và Giám đốc điều hành Moonshot AI - cho rằng việc nhận diện sai này là do “dữ liệu lập trình từ internet” đã đi vào hệ thống của họ. Yang Zhilin còn tuyên bố Kimi K2.5 vượt qua Claude trên nhiều tiêu chuẩn đánh giá AI.

Trong bài viết đăng trên tạp chí Nature vào tháng 9.2025, các nhà nghiên cứu DeepSeek nói rằng R1 không sao chép các ví dụ suy luận do mô hình của OpenAI tạo ra.

Giống như Yang Zhilin, các nhà nghiên cứu này cho rằng R1 được huấn luyện trên dữ liệu web, khiến nó dễ bị ảnh hưởng bởi nội dung do AI tạo ra.

Tại sao kỹ thuật chưng cất gây tranh cãi lớn?

Có ba lý do chính khiến chưng cất mô hình AI trở thành tâm điểm tranh cãi.

Thứ nhất: Chi phí phát triển AI cực kỳ cao

Việc huấn luyện một mô hình AI tiên tiến có thể tốn hàng trăm triệu USD, gồm chi phí phần cứng, dữ liệu và nhân lực. Chưng cất cho phép giảm đáng kể chi phí này bằng cách tận dụng đầu ra của mô hình đã được huấn luyện.

Thứ hai: Chưng cất có thể vượt qua các kiểm soát công nghệ

Mỹ đã áp dụng các hạn chế xuất khẩu chip tiên tiến để làm chậm sự phát triển AI của Trung Quốc. Tuy nhiên, chưng cất có thể giúp các công ty Trung Quốc tạo ra mô hình AI với hiệu năng tương đương đối thủ Mỹ mà không cần chip AI tiên tiến nhất.

Anthropic cảnh báo rằng kỹ thuật này có thể làm suy yếu hiệu quả các biện pháp kiểm soát xuất khẩu chip AI và các công nghệ khác của Mỹ sang Trung Quốc.

Thứ ba: Nguy cơ mất các biện pháp an toàn

Một trong những lo ngại lớn nhất là các mô hình AI được chưng cất có thể không giữ lại các biện pháp an toàn quan trọng.

Anthropic cảnh báo mô hình sao chép có thể bị sử dụng cho các mục đích nguy hiểm như giám sát, tấn công mạng hoặc phát triển vũ khí sinh học.

Công ty đứng sau Claude kêu gọi phản ứng phối hợp từ ngành công nghiệp và chính phủ để ngăn chặn tình trạng chưng cất trái phép.

“Các chiến dịch này đang gia tăng cả về cường độ lẫn mức độ tinh vi. Không còn nhiều thời gian để can thiệp và mối đe dọa vượt ra ngoài bất kỳ công ty hay khu vực nào. Việc giải quyết vấn đề này sẽ đòi hỏi hành động nhanh chóng, phối hợp giữa các công ty trong ngành, các nhà hoạch định chính sách và cộng đồng AI toàn cầu”, Anthropic cho biết trong tuyên bố dài hôm 23.2.

Công ty Mỹ cho biết đã triển khai các biện pháp mới để phát hiện và ngăn chặn chưng cất mô hình AI, gồm cả hệ thống phát hiện hành vi bất thường và xác minh tài khoản chặt chẽ hơn.

Những thay đổi lớn có thể xảy ra trong ngành AI

Cuộc tranh cãi xung quanh kỹ thuật chưng cất có thể dẫn đến những thay đổi lớn trong ngành AI, gồm tăng cường kiểm soát truy cập mô hình, hạn chế xuất khẩu công nghệ AI, phát triển biện pháp bảo vệ chống kỹ thuật này...

Anthropic cảnh báo rằng chưng cất mô hình AI có thể trở thành mối đe dọa lớn với vị thế dẫn đầu công nghệ của Mỹ nếu không được kiểm soát.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/chuyen-gia-cac-mo-hinh-ai-trung-quoc-tien-bo-nhanh-chong-nho-sao-chep-san-pham-my-246721.html