Elon Musk thừa nhận xAI dùng mô hình AI của OpenAI để huấn luyện Grok

Elon Musk thừa nhận 'một phần là đúng' trước câu hỏi về việc xAI có chưng cất mô hình AI của OpenAI để cải thiện Grok hay không.

Trong phiên tòa tại thành phố Oakland (bang California, Mỹ) hôm 1/5, Elon Musk khai rằng công ty xAI đã sử dụng kỹ thuật chưng cất mô hình AI để nâng cao năng lực cho Grok.

Chưng cất mô hình là phương pháp phổ biến trong ngành và thường được sử dụng trong nội bộ các công ty AI. Trong đó, một mô hình AI lớn đóng vai trò “giáo viên” để truyền kiến thức cho mô hình nhỏ hơn gọi là “học sinh”.

Điều đáng nói là một số phòng thí nghiệm AI nhỏ hơn sử dụng kỹ thuật này nhằm giúp mô hình AI của mình đạt được hiệu năng gần ngang ngửa đối thủ lớn hơn.

Khi bị William Savitt (luật sư chính phía OpenAI) thẩm vấn chéo tại phiên tòa liên bang Mỹ, Elon Musk thừa nhận xAI dùng mô hình AI của OpenAI để huấn luyện Grok.

Dưới đây là đoạn đối thoại giữa hai người, khi tỉ phú giàu nhất thế giới đứng trên bục nhân chứng tại phiên tòa:

William Savitt: Ông có biết chưng cất mô hình AI là gì không?

Elon Musk: Nghĩa là dùng một mô hình AI để huấn luyện một mô hình khác.

William Savitt: xAI có làm điều đó với OpenAI không?

Elon Musk: Nói chung tất cả công ty AI đều làm vậy.

William Savitt: Vậy tức là có.

Elon Musk: Một phần.

Khi bị William Savitt chất vấn sâu hơn, Elon Musk trả lời: “Đó là thông lệ tiêu chuẩn khi sử dụng các AI khác để kiểm chứng AI của bạn”.

Elon Musk thừa nhận xAI chưng cất mô hình AI của OpenAI để cải thiện Grok. Ảnh: SV.

Elon Musk thừa nhận xAI chưng cất mô hình AI của OpenAI để cải thiện Grok. Ảnh: SV.

Tranh cãi về chưng cất mô hình AI

Những năm gần đây, chưng cất mô hình ngày càng phổ biến và gây nhiều tranh cãi trong giới AI, do ranh giới giữa hợp pháp và vi phạm điều khoản hoặc chính sách của công ty thường nằm trong “vùng xám”.

OpenAI và Anthropic cáo buộc các công ty Trung Quốc chưng cất mô hình AI của họ. Cuối tháng 4, Nhà Trắng thậm chí cáo buộc Trung Quốc chưng cất các mô hình AI tiên tiến của Mỹ ở quy mô công nghiệp.

Cuộc tranh cãi bắt đầu vào tháng 1/2025 khi công ty khởi nghiệp AI DeepSeek (Trung Quốc) gây chấn động ngành công nghệ với việc ra mắt mô hình suy luận R1 có hiệu năng tương đương các sản phẩm hàng đầu Mỹ như của OpenAI, Anthropic và Google, nhưng chi phí huấn luyện thấp hơn rất nhiều. Động thái này đã làm dấy lên lo ngại tại Mỹ rằng Trung Quốc có thể bắt kịp trong cuộc đua AI bất chấp việc bị hạn chế mua chip hiệu năng cao từ Nvidia.

Sự xuất hiện của R1 góp phần kích hoạt đợt bán tháo cổ phiếu công nghệ trị giá khoảng 1.000 tỉ USD trên thị trường toàn cầu. Riêng Nvidia, công ty Mỹ chuyên cung cấp chip tiên tiến để huấn luyện các mô hình AI, mất gần 600 tỉ USD vốn hóa thị trường chỉ trong một ngày 27/1/2025.

Không lâu sau đó, OpenAI cáo buộc DeepSeek đã sử dụng kỹ thuật chưng cất mô hình AI của họ để xây dựng R1.

Về bản chất, kỹ thuật này là hợp pháp nếu được sử dụng nội bộ. Tuy nhiên, vấn đề trở nên nghiêm trọng nếu một công ty sử dụng đầu ra của mô hình đối thủ để huấn luyện sản phẩm cạnh tranh.

Đầu tháng 2/2026, OpenAI cho biết trong một bản ghi nhớ gửi Ủy ban đặc biệt của Hạ viện Mỹ về Trung Quốc rằng DeepSeek đã sử dụng kỹ thuật chưng cất liên quan đến các sản phẩm của Mỹ để huấn luyện mô hình AI thế hệ tiếp theo.

OpenAI thông báo: “Chúng tôi đã quan sát thấy các tài khoản liên quan đến nhân viên DeepSeek phát triển các phương thức nhằm vượt qua các hạn chế của OpenAI và truy cập các mô hình thông qua các bộ định tuyến bên thứ ba được che giấu nguồn gốc, cùng những cách khác nhằm ẩn danh nguồn truy cập”.

“Chúng tôi cũng biết rằng nhân viên DeepSeek đã phát triển mã để truy cập các mô hình AI của Mỹ và thu thập đầu ra phục vụ cho quá trình chưng cất theo cách lập trình tự động”, trích bản ghi nhớ.

Cuối tháng 2, Anthropic công bố báo cáo chi tiết cáo buộc DeepSeek, Moonshot AI và MiniMax đã tiến hành các chiến dịch chưng cất quy mô công nghiệp nhằm trích xuất năng lực từ mô hình Claude của họ. Theo Anthropic, ba công ty AI Trung Quốc này đã tạo khoảng 24.000 tài khoản giả và thực hiện hơn 16 triệu tương tác với Claude, vi phạm điều khoản dịch vụ và hạn chế truy cập theo khu vực.

Anthropic cho biết mục tiêu của các chiến dịch này là trích xuất các khả năng cốt lõi của Claude, gồm suy luận logic, lập trình, sử dụng công cụ tự động, phân tích dữ liệu và giải quyết vấn đề phức tạp.

Anthropic tiết lộ DeepSeek đã tạo ra hơn 150.000 cuộc hội thoại tập trung vào khả năng suy luận của Claude, trong khi Moonshot AI và MiniMax lần lượt tạo ra khoảng 3,4 triệu và 13 triệu cuộc hội thoại, nhắm vào lập trình và các chức năng khác.

Trong một bài viết trên blog, Anthropic cho biết: “Chưng cất là phương pháp huấn luyện được sử dụng rộng rãi và hợp pháp. Ví dụ, các phòng thí nghiệm AI tiên phong thường xuyên chưng cất chính mô hình của mình để tạo ra các phiên bản nhỏ hơn, rẻ hơn cho khách hàng. Thế nhưng, chưng cất cũng có thể bị lạm dụng. Các đối thủ có thể dùng nó để đạt được những năng lực mạnh từ các phòng thí nghiệm khác chỉ trong một phần nhỏ thời gian và chi phí so với việc tự phát triển”.

Google tiết lộ từng thực hiện các biện pháp nhằm ngăn chặn “các cuộc tấn công chưng cất”, hay “phương thức đánh cắp tài sản trí tuệ vi phạm điều khoản dịch vụ của công ty”.

Hôm 23/4, ông Michael Kratsios, Giám đốc Văn phòng Chính sách Khoa học và Công nghệ Nhà Trắng, viết trong một bản ghi nhớ: “Chính phủ Mỹ có thông tin cho thấy các thực thể nước ngoài, chủ yếu có trụ sở tại Trung Quốc, đang tham gia vào các chiến dịch có chủ đích, trên quy mô công nghiệp để chưng cất các hệ thống AI tiên tiến của Mỹ”.

“Bằng cách sử dụng hàng chục nghìn tài khoản trung gian để tránh bị phát hiện và sử dụng kỹ thuật jailbreak nhằm khai thác thông tin độc quyền, các chiến dịch phối hợp này đang trích xuất một cách có hệ thống năng lực từ các mô hình AI Mỹ, khai thác chuyên môn và sự đổi mới của Mỹ”, ông cho biết thêm.

Anthropic chặn OpenAI và xAI truy cập mô hình Claude

Các phòng thí nghiệm AI Mỹ cũng sử dụng mô hình AI của nhau theo những cách khác, như để kiểm tra tiến bộ và đánh giá an toàn. Song trong môi trường cạnh tranh hiện nay, một số công ty đã cắt đứt hoàn toàn quyền truy cập của đối thủ.

Tháng 8/2025, Anthropic đã chặn OpenAI truy cập mô hình lập trình Claude sau khi cáo buộc đối thủ vi phạm điều khoản dịch vụ của mình. Gần đây hơn, Anthropic chặn xAI sử dụng các mô hình AI của mình cho mục đích lập trình.

Trong quá trình thẩm vấn chéo kéo dài nhiều ngày, William Savitt đã chất vấn Elon Musk về những nỗ lực của ông nhằm kiểm soát OpenAI, cũng như tham vọng vượt qua công ty đứng sau ChatGPT.

Hôm 29/4, William Savitt đã trình bày các email và tin nhắn từ năm 2017 để làm rõ liệu Elon Musk có gây áp lực với OpenAI bằng cách giữ lại nguồn tài trợ và chiêu mộ nhà nghiên cứu chủ chốt hay không.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/elon-musk-thua-nhan-xai-dung-mo-hinh-ai-cua-openai-de-huan-luyen-grok-251001.html