DeepSeek bị nghi dùng dữ liệu OpenAI trái phép

1 ngày trước Gốc

Một số cá nhân được cho là có liên hệ với DeepSeek đã lấy đi một lượng lớn dữ liệu thông qua giao diện lập trình ứng dụng (API) của OpenAI.

Với tư cách là đối tác công nghệ và nhà đầu tư lớn nhất của OpenAI, Microsoft đã thông báo cho OpenAI về hoạt động bất thường này. Ảnh: Reuters.

Microsoft và OpenAI đang điều tra xem liệu dữ liệu đầu ra từ công nghệ của OpenAI có bị một nhóm có liên kết với startup AI Trung Quốc DeepSeek lấy đi một cách trái phép hay không, Bloomberg đưa tin.

Theo nguồn tin thân cận, các nhà nghiên cứu bảo mật của Microsoft đã phát hiện hoạt động đáng ngờ vào mùa thu năm 2024. Một số cá nhân được cho là có liên hệ với DeepSeek đã lấy đi một lượng lớn dữ liệu thông qua giao diện lập trình ứng dụng (API) của OpenAI. API này là kênh chính giúp các nhà phát triển phần mềm và khách hàng doanh nghiệp tiếp cận các dịch vụ AI của OpenAI, bao gồm các mô hình tiên tiến như ChatGPT và GPT-4.

Các nhà phát triển phần mềm có thể trả tiền cho giấy phép sử dụng API để tích hợp các mô hình AI độc quyền của OpenAI vào các ứng dụng của riêng mình.

Với tư cách là đối tác công nghệ và nhà đầu tư lớn nhất của OpenAI, Microsoft đã thông báo cho OpenAI về hoạt động bất thường này. Nếu nhóm liên kết với DeepSeek thực sự đã khai thác dữ liệu theo cách không được phép, điều này có thể vi phạm các điều khoản sử dụng của OpenAI, hoặc cho thấy họ đã vượt qua các hạn chế mà OpenAI đặt ra về lượng dữ liệu có thể truy xuất.

Hiện tại, cả Microsoft và OpenAI đều từ chối bình luận về vấn đề này. DeepSeek cũng chưa phản hồi các yêu cầu bình luận qua email của Bloomberg.

Là startup AI có trụ sở tại Trung Quốc, DeepSeek đang dần trở thành đối thủ cạnh tranh với các công ty AI hàng đầu của Mỹ. Đầu tháng 1/2025, DeepSeek đã ra mắt một mô hình AI mã nguồn mở mới mang tên R1, tuyên bố có khả năng mô phỏng cách con người suy luận.

DeepSeek khẳng định R1 có thể cạnh tranh hoặc thậm chí vượt trội so với các mô hình hàng đầu của Mỹ trên nhiều thước đo tiêu chuẩn của ngành, bao gồm các bài kiểm tra toán học và kiến thức tổng quát. Tất cả đều với mức chi phí chỉ bằng một phần nhỏ so với các công nghệ hiện có.

Sự xuất hiện của DeepSeek R1 đã gây chấn động thị trường AI và tạo ra một làn sóng bán tháo cổ phiếu công nghệ vào ngày 27/1. Các cổ phiếu liên quan đến AI như Microsoft, Nvidia, Oracle và Alphabet (công ty mẹ của Google) đều lao dốc, khiến tổng giá trị vốn hóa thị trường bốc hơi gần 1.000 tỷ USD.

Một yếu tố quan trọng khiến giới công nghệ lo lắng là DeepSeek đang cung cấp công cụ AI của mình miễn phí. Điều này có thể đẩy OpenAI vào thế khó khi giữ chân khách hàng. Vào 27/1, DeepSeek thậm chí đã vượt mặt ChatGPT của OpenAI trên bảng xếp hạng ứng dụng của Apple App Store tại Mỹ. Dấu hiệu này cho thấy người dùng đang dần chuyển sang các giải pháp thay thế.

Vấn đề được đẩy lên một cấp độ mới khi David Sacks, cố vấn AI của cựu Tổng thống Donald Trump, lên tiếng vào ngày 28/1 về “bằng chứng lớn” cho thấy DeepSeek đã sử dụng dữ liệu đầu ra từ các mô hình của OpenAI để phát triển công nghệ của riêng mình.

Trả lời phỏng vấn với Fox News, Sacks đã đề cập đến một kỹ thuật gọi là “distillation” (chưng cất mô hình), trong đó một mô hình AI sử dụng đầu ra của một mô hình khác để huấn luyện chính nó, từ đó tạo ra những năng lực tương tự.

“Có bằng chứng đáng kể cho thấy những gì DeepSeek đã làm ở đây là họ đã chưng cất kiến thức từ các mô hình của OpenAI và tôi không nghĩ rằng OpenAI sẽ hài lòng về điều này”, Sacks nói. Ông không đưa ra chi tiết cụ thể về bằng chứng.

OpenAI không trực tiếp phản hồi các cáo buộc của Sacks, nhưng công ty tuyên bố “các công ty có trụ sở tại Trung Quốc và những thực thể khác - liên tục tìm cách chưng cất các mô hình của những công ty AI hàng đầu của Mỹ”.

“Với tư cách là công ty dẫn đầu trong lĩnh vực AI, chúng tôi áp dụng nhiều biện pháp đối phó để bảo vệ tài sản trí tuệ của mình, bao gồm quy trình kiểm soát chặt chẽ những năng lực tiên tiến nào được đưa vào các mô hình phát hành công khai. Chúng tôi tin rằng điều quan trọng hàng đầu là hợp tác chặt chẽ với chính phủ Mỹ để bảo vệ các mô hình tiên tiến nhất khỏi nỗ lực tiếp cận của các đối thủ và đối thủ cạnh tranh nhằm lấy công nghệ của Mỹ”, phát ngôn viên của OpenAI cho biết.

Thúy Liên

Nguồn Znews: https://znews.vn/microsoft-dieu-tra-deepseek-nghi-truy-xuat-du-lieu-openai-trai-phep-post1528219.html