Elon Musk thừa nhận xAI dùng mô hình AI của OpenAI để huấn luyện Grok

Elon Musk thừa nhận 'một phần là đúng' trước câu hỏi về việc xAI có chưng cất mô hình AI của OpenAI để cải thiện Grok hay không.

4 giờ trước Gốc

Trong phiên tòa tại thành phố Oakland (bang California, Mỹ) hôm 1/5, Elon Musk khai rằng công ty xAI đã sử dụng kỹ thuật chưng cất mô hình AI để nâng cao năng lực cho Grok.

Chưng cất mô hình là phương pháp phổ biến trong ngành và thường được sử dụng trong nội bộ các công ty AI. Trong đó, một mô hình AI lớn đóng vai trò “giáo viên” để truyền kiến thức cho mô hình nhỏ hơn gọi là “học sinh”.

Điều đáng nói là một số phòng thí nghiệm AI nhỏ hơn sử dụng kỹ thuật này nhằm giúp mô hình AI của mình đạt được hiệu năng gần ngang ngửa đối thủ lớn hơn.

Khi bị William Savitt (luật sư chính phía OpenAI) thẩm vấn chéo tại phiên tòa liên bang Mỹ, Elon Musk thừa nhận xAI dùng mô hình AI của OpenAI để huấn luyện Grok.

Dưới đây là đoạn đối thoại giữa hai người, khi tỉ phú giàu nhất thế giới đứng trên bục nhân chứng tại phiên tòa:

William Savitt: Ông có biết chưng cất mô hình AI là gì không?

Elon Musk: Nghĩa là dùng một mô hình AI để huấn luyện một mô hình khác.

William Savitt: xAI có làm điều đó với OpenAI không?

Elon Musk: Nói chung tất cả công ty AI đều làm vậy.

William Savitt: Vậy tức là có.

Elon Musk: Một phần.

Khi bị William Savitt chất vấn sâu hơn, Elon Musk trả lời: “Đó là thông lệ tiêu chuẩn khi sử dụng các AI khác để kiểm chứng AI của bạn”.

Elon Musk thừa nhận xAI chưng cất mô hình AI của OpenAI để cải thiện Grok. Ảnh: SV.

Tranh cãi về chưng cất mô hình AI

Những năm gần đây, chưng cất mô hình ngày càng phổ biến và gây nhiều tranh cãi trong giới AI, do ranh giới giữa hợp pháp và vi phạm điều khoản hoặc chính sách của công ty thường nằm trong “vùng xám”.

OpenAI và Anthropic cáo buộc các công ty Trung Quốc chưng cất mô hình AI của họ. Cuối tháng 4, Nhà Trắng thậm chí cáo buộc Trung Quốc chưng cất các mô hình AI tiên tiến của Mỹ ở quy mô công nghiệp.

Cuộc tranh cãi bắt đầu vào tháng 1/2025 khi công ty khởi nghiệp AI DeepSeek (Trung Quốc) gây chấn động ngành công nghệ với việc ra mắt mô hình suy luận R1 có hiệu năng tương đương các sản phẩm hàng đầu Mỹ như của OpenAI, Anthropic và Google, nhưng chi phí huấn luyện thấp hơn rất nhiều. Động thái này đã làm dấy lên lo ngại tại Mỹ rằng Trung Quốc có thể bắt kịp trong cuộc đua AI bất chấp việc bị hạn chế mua chip hiệu năng cao từ Nvidia.

Sự xuất hiện của R1 góp phần kích hoạt đợt bán tháo cổ phiếu công nghệ trị giá khoảng 1.000 tỉ USD trên thị trường toàn cầu. Riêng Nvidia, công ty Mỹ chuyên cung cấp chip tiên tiến để huấn luyện các mô hình AI, mất gần 600 tỉ USD vốn hóa thị trường chỉ trong một ngày 27/1/2025.

Không lâu sau đó, OpenAI cáo buộc DeepSeek đã sử dụng kỹ thuật chưng cất mô hình AI của họ để xây dựng R1.

Về bản chất, kỹ thuật này là hợp pháp nếu được sử dụng nội bộ. Tuy nhiên, vấn đề trở nên nghiêm trọng nếu một công ty sử dụng đầu ra của mô hình đối thủ để huấn luyện sản phẩm cạnh tranh.

Đầu tháng 2/2026, OpenAI cho biết trong một bản ghi nhớ gửi Ủy ban đặc biệt của Hạ viện Mỹ về Trung Quốc rằng DeepSeek đã sử dụng kỹ thuật chưng cất liên quan đến các sản phẩm của Mỹ để huấn luyện mô hình AI thế hệ tiếp theo.

OpenAI thông báo: “Chúng tôi đã quan sát thấy các tài khoản liên quan đến nhân viên DeepSeek phát triển các phương thức nhằm vượt qua các hạn chế của OpenAI và truy cập các mô hình thông qua các bộ định tuyến bên thứ ba được che giấu nguồn gốc, cùng những cách khác nhằm ẩn danh nguồn truy cập”.

“Chúng tôi cũng biết rằng nhân viên DeepSeek đã phát triển mã để truy cập các mô hình AI của Mỹ và thu thập đầu ra phục vụ cho quá trình chưng cất theo cách lập trình tự động”, trích bản ghi nhớ.

Cuối tháng 2, Anthropic công bố báo cáo chi tiết cáo buộc DeepSeek, Moonshot AI và MiniMax đã tiến hành các chiến dịch chưng cất quy mô công nghiệp nhằm trích xuất năng lực từ mô hình Claude của họ. Theo Anthropic, ba công ty AI Trung Quốc này đã tạo khoảng 24.000 tài khoản giả và thực hiện hơn 16 triệu tương tác với Claude, vi phạm điều khoản dịch vụ và hạn chế truy cập theo khu vực.

Anthropic cho biết mục tiêu của các chiến dịch này là trích xuất các khả năng cốt lõi của Claude, gồm suy luận logic, lập trình, sử dụng công cụ tự động, phân tích dữ liệu và giải quyết vấn đề phức tạp.

Anthropic tiết lộ DeepSeek đã tạo ra hơn 150.000 cuộc hội thoại tập trung vào khả năng suy luận của Claude, trong khi Moonshot AI và MiniMax lần lượt tạo ra khoảng 3,4 triệu và 13 triệu cuộc hội thoại, nhắm vào lập trình và các chức năng khác.

Trong một bài viết trên blog, Anthropic cho biết: “Chưng cất là phương pháp huấn luyện được sử dụng rộng rãi và hợp pháp. Ví dụ, các phòng thí nghiệm AI tiên phong thường xuyên chưng cất chính mô hình của mình để tạo ra các phiên bản nhỏ hơn, rẻ hơn cho khách hàng. Thế nhưng, chưng cất cũng có thể bị lạm dụng. Các đối thủ có thể dùng nó để đạt được những năng lực mạnh từ các phòng thí nghiệm khác chỉ trong một phần nhỏ thời gian và chi phí so với việc tự phát triển”.

Google tiết lộ từng thực hiện các biện pháp nhằm ngăn chặn “các cuộc tấn công chưng cất”, hay “phương thức đánh cắp tài sản trí tuệ vi phạm điều khoản dịch vụ của công ty”.

Hôm 23/4, ông Michael Kratsios, Giám đốc Văn phòng Chính sách Khoa học và Công nghệ Nhà Trắng, viết trong một bản ghi nhớ: “Chính phủ Mỹ có thông tin cho thấy các thực thể nước ngoài, chủ yếu có trụ sở tại Trung Quốc, đang tham gia vào các chiến dịch có chủ đích, trên quy mô công nghiệp để chưng cất các hệ thống AI tiên tiến của Mỹ”.

“Bằng cách sử dụng hàng chục nghìn tài khoản trung gian để tránh bị phát hiện và sử dụng kỹ thuật jailbreak nhằm khai thác thông tin độc quyền, các chiến dịch phối hợp này đang trích xuất một cách có hệ thống năng lực từ các mô hình AI Mỹ, khai thác chuyên môn và sự đổi mới của Mỹ”, ông cho biết thêm.

Anthropic chặn OpenAI và xAI truy cập mô hình Claude

Các phòng thí nghiệm AI Mỹ cũng sử dụng mô hình AI của nhau theo những cách khác, như để kiểm tra tiến bộ và đánh giá an toàn. Song trong môi trường cạnh tranh hiện nay, một số công ty đã cắt đứt hoàn toàn quyền truy cập của đối thủ.

Tháng 8/2025, Anthropic đã chặn OpenAI truy cập mô hình lập trình Claude sau khi cáo buộc đối thủ vi phạm điều khoản dịch vụ của mình. Gần đây hơn, Anthropic chặn xAI sử dụng các mô hình AI của mình cho mục đích lập trình.

Trong quá trình thẩm vấn chéo kéo dài nhiều ngày, William Savitt đã chất vấn Elon Musk về những nỗ lực của ông nhằm kiểm soát OpenAI, cũng như tham vọng vượt qua công ty đứng sau ChatGPT.

Hôm 29/4, William Savitt đã trình bày các email và tin nhắn từ năm 2017 để làm rõ liệu Elon Musk có gây áp lực với OpenAI bằng cách giữ lại nguồn tài trợ và chiêu mộ nhà nghiên cứu chủ chốt hay không.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/elon-musk-thua-nhan-xai-dung-mo-hinh-ai-cua-openai-de-huan-luyen-grok-251001.html

Lầu Năm Góc đưa 7 gã khổng lồ AI vào mạng lưới mật, gạt Anthropic ra ngoài

Tỷ phú Elon Musk dùng điện thoại gì?

Tên lửa mạnh nhất châu Âu đưa vệ tinh Internet của Amazon vào quỹ đạo

Tin nóng

Đây là cách Apple bảo vệ giá bán iPhone 18

5 giờ

iPhone 18 nhiều khả năng vẫn giữ nguyên dung lượng RAM 8 GB do chi phí bộ nhớ tăng cao trong thời gian tới.

Gọng kìm trên không gian mạng

Chuyên trang Công an Đà Nẵng - Báo Công an Nhân dân

3 giờ

Trong những năm qua, Phòng An ninh mạng và phòng, chống tội phạm sử dụng công nghệ cao (Phòng ANM) Công an TP Đà Nẵng hiệp đồng Trung tâm Chuyển đổi số và Công nghệ chiến lược Đà Nẵng (Trung tâm DDS) thuộc Sở Khoa học và Công nghệ bảo đảm an ninh mạng, bảo mật thông tin, an ninh dữ liệu trong công cuộc chuyển đổi số đang diễn ra mạnh mẽ của TP Đà Nẵng.

UAV vận chuyển hàng hóa xuyên biển hàng trăm km

2 giờ

Tuần qua, tuyến đường vận chuyển hàng hóa bằng máy bay không người lái (UAV) đầu tiên qua Bột Hải chính thức đi vào hoạt động.

Phổ cập AI toàn dân: Việt Nam cần gì để không bỏ lỡ 'cơ hội lịch sử'?

2 giờ

Với lợi thế về dân số trẻ, mức độ tiếp cận công nghệ cao, Việt Nam đang đứng trước một 'cơ hội lịch sử' để bứt phá về phát triển nguồn nhân lực số và năng lực cạnh tranh quốc gia. Tuy nhiên, để không bỏ lỡ thời điểm quan trọng này, bài toán đặt ra không chỉ dừng ở việc tiếp cận công nghệ, mà là làm thế nào phổ cập trí tuệ nhân tạo (AI) tới toàn dân một cách thực chất, hiệu quả và bền vững.

Không chỉ giới trẻ, người cao tuổi Trung Quốc cũng đang 'sống cùng AI'

2 giờ

AI không chỉ là xu hướng công nghệ mà còn mở ra cơ hội giúp người cao tuổi sống độc lập hơn, thuận tiện hơn và kết nối hơn.

Sẵn sàng cho đô thị thông minh

4 giờ

TPHCM đang nỗ lực hướng đến một đô thị hiện đại và bền vững, nơi công nghệ và dữ liệu không chỉ là công cụ quản lý, mà trở thành nền tảng phục vụ trực tiếp cho người dân, tạo dựng một môi trường sống thông minh, an toàn và giàu giá trị nhân văn.

Tin mới

Lắp thiết bị kích sóng trái phép có thể bị phạt 30 triệu đồng

16 phút

Thời gian gần đây, tình trạng người dân tự ý lắp đặt thiết bị kích sóng di động (repeater) để cải thiện tín hiệu trong nhà diễn ra khá phổ biến, kéo theo nhiều hệ lụy đối với mạng viễn thông.

Định hướng phát triển truyền thông Phật giáo trong xã hội số

1 giờ

Trong kỷ nguyên số, truyền thông không còn đơn thuần là một công cụ kỹ thuật, mà đã trở thành một không gian hoằng pháp mới, nơi giáo lý Phật giáo được kiến tạo, diễn giải và lan tỏa trong những cấu trúc tương tác của mạng xã hội.

Người dùng sẽ gặp rắc rối nào khi không xác nhận thuê bao chính chủ?

1 giờ

Theo Cục Viễn thông, người dùng nên xác nhận thuê bao chính chủ để hưởng những quyền lợi và tránh những rắc rối cho những lần xác thực thông tin sau này.

Cơn ác mộng 9 giây và sự sụp đổ của niềm tin truyền thống

1 giờ

Chỉ với một đoạn âm thanh ngắn ngủi trích xuất từ mạng xã hội, 'cơn ác mộng 9 giây' đã chính thức bắt đầu khi AI có thể tái tạo hoàn hảo giọng nói của bất kỳ ai, khiến ranh giới giữa thực và ảo mong manh hơn bao giờ hết.

Nâng cấp trạm làm việc AI tại nhà với Intel Core Ultra 5

1 giờ

Core Ultra 5 có thể xử lý AI trực tiếp trên máy, giảm phụ thuộc vào cloud và giúp người dùng dễ dàng xây dựng workstation mạnh mẽ tại nhà.

Ứng dụng BIM và kết cấu thép mở đường cho tiến độ 'thần tốc' Trung tâm Triển lãm Quốc gia

1 giờ

Việc hoàn thành Trung tâm Hội chợ Triển lãm Quốc gia chỉ trong 10 tháng cho thấy bước tiến của ngành Xây dựng Việt Nam. Thành công này đến từ năng lực thi công kết cấu thép, ứng dụng công nghệ hiện đại và vai trò điều phối của BIM.

'Đánh chặn' hơn 140.000 lượt tấn công mạng vào hệ thống chính quyền điện tử Đà Nẵng

2 giờ

4 tháng đầu năm, lực lượng an ninh mạng đã ngăn chặn 140.826 lượt tấn công mạng, mã độc, bảo vệ hệ thống thông tin chính quyền điện tử Đà Nẵng.

4 phương thức xác thực sim chính chủ mà người dùng cần biết

2 giờ

Thông tư số 08/2026/TT-BKHCN hướng dẫn việc xác thực thông tin thuê bao di động mặt đất quy định 4 phương thức xác thực thông tin thuê bao; các trường hợp không phải xác thực lại thông tin thuê bao; xác thực sinh trắc học khuôn mặt...