OpenAI khiến DeepSeek và các đối thủ khó sao chép mô hình AI hơn

Nhằm bảo vệ 'báu vật' của mình, OpenAI hiện yêu cầu các nhà phát triển phải xác minh danh tính bằng giấy tờ tùy thân do chính phủ cấp nếu muốn truy cập vào những mô hình trí tuệ nhân tạo (AI) tiên tiến nhất của hãng.

Dù động thái này được công bố để ngăn chặn việc sử dụng sai mục đích, nhưng mối lo sâu xa hơn dần lộ diện: Các mô hình AI của OpenAI đang bị thu thập để đào tạo ra sản phẩm cạnh tranh.

Nghiên cứu mới từ Copyleaks (hãng chuyên phát hiện nội dung do AI tạo) đã đưa ra bằng chứng lý giải tại sao OpenAI có thể phải hành động ngay lúc này. Bằng cách sử dụng hệ thống xác định “dấu vết phong cách” đặc trưng của các mô hình AI, Copyleaks ước tính rằng 74% đầu ra của mô hình suy luận DeepSeek-R1 (Trung Quốc) được phân loại có phong cách giống được viết bởi OpenAI. Điều này không chỉ gợi ý về việc trùng lặp mà còn ngụ ý rằng đang có sự bắt chước.

Hệ thống phân loại của Copyleaks cũng thử nghiệm với các mô hình AI khác như Phi-4 của Microsoft và Grok-1 của xAI (do Elon Musk điều hành). Hai mô hình AI này gần như không có sự tương đồng với OpenAI, khi tỷ lệ “không trùng khớp” lần lượt là 99,3% và 100%, cho thấy chúng được huấn luyện độc lập. Mô hình Mixtral của Mistral có một số điểm tương đồng với sản phẩm OpenAI, nhưng số liệu từ DeepSeek-R1 là rõ rệt nhất.

Biểu đồ cho thấy sự tương đồng về "dấu vết phong cách" của DeepSeek-R1, Mixtral, Phi-4, Grok-1 so với các mô hình OpenAI - Ảnh: Copyleaks

Biểu đồ cho thấy sự tương đồng về "dấu vết phong cách" của DeepSeek-R1, Mixtral, Phi-4, Grok-1 so với các mô hình OpenAI - Ảnh: Copyleaks

Nghiên cứu cho thấy rằng ngay cả khi các mô hình được yêu cầu viết theo những tông giọng hay định dạng khác nhau, chúng vẫn để lại “dấu vết” phong cách có thể phát hiện, giống dấu vết ngôn ngữ.

Những dấu vết này tồn tại xuyên suốt các nhiệm vụ, chủ đề và lời nhắc, giờ đây có thể được truy vết với độ chính xác nhất định. Điều này mang lại ý nghĩa lớn trong việc phát hiện việc sử dụng mô hình AI trái phép, thực thi các thỏa thuận cấp phép và bảo vệ tài sản trí tuệ.

OpenAI không phản hồi khi trang Insider đề nghị bình luận, nhưng công ty đã đưa ra một số lý do cho việc áp dụng quy trình xác minh mới. “Đáng tiếc là một số nhỏ nhà phát triển đã cố tình sử dụng API OpenAI vi phạm chính sách sử dụng của chúng tôi”, OpenAI viết trong thông báo gần đây.

API (Application Programming Interface) là giao diện lập trình ứng dụng. Nói một cách đơn giản, API là tập hợp các quy tắc cho phép các phần mềm hoặc hệ thống khác nhau giao tiếp với nhau. Nó giống một cửa sổ hoặc cổng mà qua đó ứng dụng có thể "nói chuyện" với ứng dụng khác mà không cần biết nội bộ bên trong hoạt động ra sao.

OpenAI cáo buộc DeepSeek có thể đã chưng cất mô hình

Đầu năm nay, ngay sau khi DeepSeek gây ấn tượng với cộng đồng AI bằng mô hình suy luận R1 có hiệu năng tương tự sản phẩm của OpenAI, công ty khởi nghiệp Mỹ cho biết: “Chúng tôi nhận thấy và đang xem xét các dấu hiệu cho thấy DeepSeek có thể đã chưng cất mô hình của chúng tôi một cách không phù hợp”.

Chưng cất trong AI là kỹ thuật học máy trong đó một mô hình nhỏ hơn, đơn giản hơn (gọi là mô hình học sinh) được huấn luyện để bắt chước hiệu suất của mô hình lớn hơn, phức tạp hơn (gọi là mô hình giáo viên).

Cách hoạt động của chưng cất

Mô hình giáo viên: Một mô hình AI lớn, mạnh mẽ được huấn luyện trước trên một lượng dữ liệu lớn.

Mô hình học sinh: Một mô hình nhỏ hơn được huấn luyện bằng cách học lại từ đầu ra của mô hình giáo viên thay vì chỉ dựa vào dữ liệu gốc.

Chuyển giao kiến thức: Mô hình học sinh học cách đưa ra các dự đoán tương tự như mô hình giáo viên nhưng với ít tài nguyên tính toán hơn.

Dù đây là kỹ thuật phổ biến trong nghiên cứu AI, nhưng làm việc này mà không có sự cho phép có thể vi phạm điều khoản dịch vụ của OpenAI.

Bài báo nghiên cứu về R1 của DeepSeek mô tả việc sử dụng kỹ thuật chưng cất với các mô hình mã nguồn mở, nhưng không nhắc đến OpenAI. Trang Insider đã hỏi DeepSeek về cáo buộc sao chép này nhưng không nhận được phản hồi.

Tuy vậy, một số người cho rằng chính OpenAI cũng xây dựng các mô hình AI đầu tiên của mình bằng cách thu thập dữ liệu từ internet, gồm cả nội dung từ các nhà xuất bản tin tức, tác giả và người sáng tạo, thường là không có sự đồng ý của họ. Vậy có phải là “đạo đức giả” khi OpenAI phàn nàn việc người khác sử dụng kết quả đầu ra của mình theo cách tương tự không?

“Vấn đề cốt lõi là sự đồng thuận và minh bạch”, Alon Yamin, Giám đốc điều hành Copyleaks, nhấn mạnh.

Việc huấn luyện dựa trên nội dung có bản quyền của con người mà không có sự cho phép là một vấn đề. Thế nhưng, việc sử dụng kết quả đầu ra của các hệ thống AI độc quyền để đào tạo các mô hình cạnh tranh lại là một vấn đề khác, giống kỹ thuật đảo ngược (“mổ xẻ” và tái tạo lại) sản phẩm của người khác, Alon Yamin giải thích.

Alon Yamin cho rằng dù cả hai hành vi đều gây tranh cãi về mặt đạo đức, nhưng việc huấn luyện trên đầu ra của OpenAI còn tiềm ẩn rủi ro cạnh tranh, vì điều này về bản chất là chuyển giao thành quả sáng tạo mà không có sự đồng thuận hay bồi thường cho bên phát triển ban đầu.

Khi các công ty AI chạy đua phát triển những mô hình ngày càng mạnh mẽ hơn, cuộc tranh luận về quyền sở hữu và quyền sử dụng dữ liệu đào tạo càng gay gắt. Những công cụ như hệ thống dấu vân tay kỹ thuật số của Copyleaks có thể là một giải pháp tiềm năng để truy vết và xác minh tác quyền ở cấp độ mô hình AI. Với OpenAI và các đối thủ, điều này có thể giúp ích trong việc bảo vệ tài sản trí tuệ nhưng cũng là lời cảnh báo nếu sao chép người khác.

OpenAI, Microsoft, Meta dùng kỹ thuật chưng cất như DeepSeek để tạo mô hình AI rẻ hơn

Các công ty AI hàng đầu như OpenAI, Microsoft và Meta Platforms đang chuyển sang dùng quy trình chưng cất nhằm tạo ra mô hình rẻ hơn để người tiêu dùng và doanh nghiệp có thể dễ dàng tiếp cận.

Kỹ thuật này đã thu hút sự chú ý rộng rãi sau khi công ty khởi nghiệp DeepSeek sử dụng nó để xây dựng các mô hình AI mạnh mẽ và hiệu quả, dựa trên hệ thống mã nguồn mở do Meta Platforms và Alibaba phát hành. Đột phá này từng làm lung lay niềm tin vào vị thế dẫn đầu của Thung lũng Silicon trong lĩnh vực AI, khiến các nhà đầu tư Phố Wall bán tháo hàng tỉ USD cổ phiếu các tập đoàn công nghệ lớn Mỹ.

Dù chưng cất đã được sử dụng rộng rãi trong nhiều năm, những tiến bộ gần đây đã khiến các chuyên gia trong ngành tin rằng quy trình này sẽ ngày càng trở thành lợi thế lớn cho các công ty khởi nghiệp đang tìm kiếm cách thức xây dựng ứng dụng AI với chi phí thấp hơn.

“Chưng cất khá kỳ diệu. Đó là quá trình tận dụng một mô hình tiên tiến lớn và sử dụng nó để dạy một mô hình nhỏ hơn cực kỳ hiệu quả trong các nhiệm vụ cụ thể, với chi phí rẻ và tốc độ xử lý cực nhanh”, Olivier Godement, trưởng bộ phận sản phẩm của nền tảng OpenAI, nhận xét.

Các mô hình ngôn ngữ lớn như GPT-4 của OpenAI, Google Gemini, Llama của Meta Platforms đòi hỏi lượng dữ liệu khổng lồ và sức mạnh tính toán đáng kể để phát triển và duy trì. Dù các công ty không tiết lộ chính xác chi phí đào tạo những mô hình này, con số ước tính có thể lên đến hàng trăm triệu USD. Nhờ chưng cất, các nhà phát triển và doanh nghiệp có thể đạt được khả năng của những mô hình này với chi phí chỉ bằng một phần nhỏ, cho phép các ứng dụng AI chạy nhanh chóng trên các thiết bị như máy tính xách tay và smartphone.

Các nhà phát triển có thể sử dụng nền tảng của OpenAI để thực hiện chưng cất, học hỏi từ những mô hình ngôn ngữ lớn vốn là nền tảng cho ChatGPT. Microsoft, nhà đầu tư lớn nhất vào OpenAI (gần 14 tỉ USD), đã sử dụng GPT-4 để chưng cất và phát triển dòng mô hình ngôn ngữ nhỏ Phi như một phần quan hệ hợp tác thương mại.

OpenAI tin rằng DeepSeek đã dựa vào mô hình AI của họ để đào tạo mô hình nguồn mở V3 và R1 - hành động vi phạm điều khoản dịch vụ của công ty Mỹ.

OpenAI, Microsoft và Meta Platforms đang dùng quy trình chưng cất giống DeepSeek nhằm tạo ra mô hình AI rẻ hơn để người tiêu dùng và doanh nghiệp có thể dễ dàng tiếp cận - Ảnh: Internet

OpenAI, Microsoft và Meta Platforms đang dùng quy trình chưng cất giống DeepSeek nhằm tạo ra mô hình AI rẻ hơn để người tiêu dùng và doanh nghiệp có thể dễ dàng tiếp cận - Ảnh: Internet

Dù chưng cất có thể tạo ra mô hình AI hiệu suất cao, các chuyên gia cho rằng chúng có những hạn chế nhất định.

“Chưng cất đặt ra sự đánh đổi thú vị. Nếu làm cho mô hình AI nhỏ hơn, bạn không thể tránh khỏi việc giảm bớt khả năng của nó”, chuyên gia Ahmed Awadallah thuộc Microsoft Research cho biết. Ông giải thích rằng một mô hình chưng cất có thể được thiết kế để tóm tắt email rất tốt chẳng hạn, nhưng lại không thể làm tốt các nhiệm vụ khác.

David Cox, Phó chủ tịch phụ trách mô hình AI tại IBM Research, nhận định rằng hầu hết doanh nghiệp không cần một mô hình khổng lồ để vận hành sản phẩm của họ. Các mô hình chưng cất đủ mạnh để sử dụng trong các chatbot hỗ trợ khách hàng hoặc chạy trên thiết bị nhỏ như smartphone.

“Mỗi khi bạn có thể giảm chi phí mà vẫn đạt hiệu suất mong muốn, hầu như không có lý do gì để không làm điều đó”, ông nói thêm.

Điều này đặt ra một thách thức với hoạt động kinh doanh của các công ty AI hàng đầu. Khi các nhà phát triển sử dụng các mô hình chưng cất của OpenAI, chi phí vận hành thấp hơn, chi phí tạo ra rẻ hơn và do đó doanh thu cũng ít hơn. Các công ty như OpenAI thường tính phí thấp hơn với các mô hình chưng cất vì chúng tiêu tốn ít tài nguyên tính toán hơn.

Tuy nhiên, Olivier Godement lập luận rằng các mô hình ngôn ngữ lớn vẫn sẽ cần thiết cho “những nhiệm vụ đòi hỏi trí tuệ cao và có rủi ro lớn”, trong đó “các doanh nghiệp sẵn sàng trả nhiều tiền hơn để có độ chính xác và tin cậy cao”. Ông cũng cho rằng các mô hình ngôn ngữ lớn sẽ tiếp tục được sử dụng để khám phá những khả năng mới, sau đó có thể được chưng cất thành mô hình nhỏ hơn.

Dù vậy, OpenAI đặt mục tiêu ngăn chặn việc các mô hình ngôn ngữ lớn của họ bị chưng cất để đào tạo ra đối thủ cạnh tranh. Công ty Mỹ có các đội ngũ giám sát việc sử dụng và có thể thu hồi quyền truy cập của những người dùng mà họ nghi ngờ đang tạo ra lượng lớn dữ liệu để xuất và đào tạo ra đối thủ cạnh tranh. OpenAI đã thực hiện điều này với một số tài khoản mà họ cho là có liên kết với DeepSeek. Tuy nhiên, hầu hết hành động này chỉ được thực hiện sau khi hành vi vi phạm đã xảy ra.

“OpenAI đã cố gắng bảo vệ chống lại chưng cất trong một thời gian dài, nhưng rất khó để ngăn chặn hoàn toàn”, theo Douwe Kiela, Giám đốc điều hành Contextual AI - công ty khởi nghiệp chuyên phát triển công cụ truy xuất thông tin cho doanh nghiệp.

Việc chưng cất là chiến thắng cho những người ủng hộ mô hình AI nguồn mở, khi công nghệ được cung cấp miễn phí để các nhà phát triển xây dựng và phát triển tiếp. DeepSeek cũng đã công khai nguồn mở các mô hình AI của họ cho nhà phát triển.

“Chúng tôi sẽ sử dụng việc chưng cất và đưa nó vào sản phẩm của mình ngay lập tức. Đó chính là ý tưởng của mã nguồn mở. Bạn có thể hưởng lợi từ tiến bộ của tất cả mọi người, miễn là các quy trình đó được mở”, Yann LeCun (Giám đốc Khoa học AI của Meta Platforms) nói.

Song cũng vì chưng cất mà các nhà phát triển mô hình AI đầu tư hàng tỉ USD để nâng cao khả năng của hệ thống phải đối mặt với các đối thủ có thể bắt kịp rất nhanh, như những gì DeepSeek thể hiện gần đây. Điều này đặt ra câu hỏi về lợi thế của người đi đầu trong việc xây dựng các mô hình ngôn ngữ lớn khi khả năng của chúng có thể bị sao chép chỉ trong vài tháng.

“Trong một thế giới nơi mọi thứ đang thay đổi quá nhanh, bạn có thể chi rất nhiều tiền, làm mọi thứ theo cách khó khăn nhất, nhưng sau đó toàn bộ ngành công nghiệp vẫn theo sát bạn. Vậy nên đây là một bối cảnh kinh doanh thú vị nhưng cũng đầy thách thức”, David Cox nhận xét.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/openai-khien-deepseek-va-cac-doi-thu-kho-sao-chep-mo-hinh-ai-hon-231649.html