Cuộc cạnh tranh 'ngang tài ngang sức' giữa DeepSeek và OpenAI

Cuộc cạnh tranh về mô hình AI đang thu hút sự chú ý hơn bao giờ hết, nổi bật là cuộc đua giữa OpenAI và DeepSeek, đặc biệt sau khi DeepSeek cho ra mắt DeepSeek-R1.

Tháng 1-2025, công ty công nghệ khởi nghiệp DeepSeek (Trung Quốc) cho ra mắt mô hình trí tuệ nhân tạo (AI) DeepSeek-R1. Ngay lập tức, DeepSeek-R1 khuấy đảo giới công nghệ.

Đài CNN gọi DeepSeek-R1 là “mô hình AI hiệu quả và mạnh mẽ đến bất ngờ của Trung Quốc, đã làm chấn động ngành công nghệ”. Nhà đầu tư công nghệ nổi tiếng Marc Andreessen gọi sự ra đời của DeepSeek-R1 là "khoảnh khắc Sputnik của AI" khi mô hình này gần như có thể sánh ngang với khả năng làm việc của các đối thủ nổi tiếng hơn, nhưng chi phí lại ít tốn kém hơn nhiều.

Chính sự ưu việt của DeepSeek-R1 khiến nhiều công ty công nghệ lo lắng, trong đó có OpenAI của Mỹ, công ty sở hữu ứng dụng ChatGPT nổi tiếng toàn cầu.

 Hình ảnh logo ứng dụng DeepSeek và ChatGPT trên màn hình điện thoại. Ảnh: REUTERS

Hình ảnh logo ứng dụng DeepSeek và ChatGPT trên màn hình điện thoại. Ảnh: REUTERS

Điều gì khiến OpenAI lo lắng?

DeepSeek được doanh nhân trẻ người Trung Quốc Lương Văn Phong thành lập vào cuối năm 2023. Giống như các công ty khởi nghiệp về AI, DeepSeek đã phát hành nhiều mô hình AI khác nhau trong năm qua thu hút được sự chú ý của những người trong ngành.

Tuy nhiên, mãi đến khi DeepSeek-R1 được cho ra mắt, giới công nghệ mới đổ dồn sự chú ý về DeepSeek, do chi phí hoạt động của mô hình AI do công ty này đầu tư thấp đến mức đáng kinh ngạc. AI là một công nghệ ngốn điện và tốn kém. Nó tốn kém đến mức các nhà lãnh đạo công nghệ quyền lực nhất của Mỹ đang mua lại các công ty điện hạt nhân để cung cấp điện cần thiết cho các mô hình AI của họ.

Đầu năm nay, Meta – công ty sở hữu Facebook – cho biết sẽ chi hơn 65 tỉ USD trong năm cho việc phát triển AI. Năm 2024, ông Sam Altman – Giám đốc điều hành của OpenAI – cho biết ngành công nghiệp AI sẽ cần hàng ngàn tỉ USD đầu tư để hỗ trợ phát triển các chip cần thiết trong việc cung cấp năng lượng cho các trung tâm dữ liệu. Các trung tâm này có vai trò chạy các mô hình phức tạp.

Tuy nhiên, theo công bố của DeepSeek, công ty này không cần quá nhiều chi phí như vậy để phát triển AI. DeepSeek cho biết công ty chỉ chi 5,6 triệu USD để cung cấp năng lượng cho mô hình AI cơ bản của mình, ít hơn nhiều so với hàng trăm triệu, thậm chí hàng tỉ USD mà các công ty công nghệ lớn của Mỹ chi cho các mô hình AI.

Khi xem xét đến vấn đề nguyên liệu đầu vào, nhiều người thậm chí còn bất ngờ hơn. Theo CNN, trong nhiều năm qua, Mỹ đã hạn chế cung cấp chip AI cho Trung Quốc, với lý do lo ngại về an ninh quốc gia. Điều đó có nghĩa là DeepSeek đã tạo ra mô hình AI chi phí thấp dựa trên các chip AI có chất lượng tương đối thấp.

 CEO DeepSeek Lương Văn Phong. Ảnh: CCTV

CEO DeepSeek Lương Văn Phong. Ảnh: CCTV

Dù chi phí đầu vào thấp là vậy nhưng DeepSeek lại gây ấn tượng mạnh mẽ. Với mã nguồn mở, DeepSeek-R1 cho phép các công ty khác có thể thử nghiệm và phát triển thêm để cải tiến mô hình này.

Theo thống kê của CNN, ngay sau khi DeepSeek-R1 ra mắt, lượt tải của DeepSeek trên nền tảng tải ứng dụng đã tăng vọt, có thời điểm vượt qua ChatGPT.

Rượt đuổi cuộc đua giữa OpenAI và DeepSeek

Cuối tháng 2, đại diện OpenAI cho biết họ đã tìm thấy bằng chứng cho thấy DeepSeek sử dụng các mô hình độc quyền của Open AI để đào tạo cho mô hình AI của họ. Trả lời tờ Financial Times, đại diện Open AI cho biết họ nghi DeepSeek đã “chưng cất” các mô hình của họ.

Theo Financial Times, “chưng cất” là thuật ngữ ám chỉ các công ty công nghệ sử dụng đầu ra từ các mô hình lớn, có nhiều tiềm năng sang các mô hình nhỏ hơn, cho phép các mô hình nhỏ đạt được kết quả tương tự mô hình lớn với chi phí thấp hơn nhiều.

Vào thời điểm đó, OpenAI từ chối bình luận thêm hoặc cung cấp thông tin chi tiết về bằng chứng về vụ việc.

Tuy nhiên, quan điểm này từ phía OpenAI đã có sức ảnh hưởng đến giới công nghệ. Thậm chí, mục Công nghệ của đài CNBC hôm 21-2 đăng tải bài viết thẳng thắn đặt tiêu đề “Cách DeepSeek sử dụng phương pháp ‘chưng cất’ để đào tạo mô hình AI của họ và ý nghĩa của hành vi này đối với các công ty như OpenAI”.

Đồng quan điểm, trước đó, ông David Sacks – cố vấn về AI và tiền điện tử của Nhà Trắng – cho rằng "có khả năng" đã xảy ra hành vi trộm cắp giữa mô hình AI của DeepSeek với mô hình AI của OpenAI.

“Có một kỹ thuật trong AI gọi là chưng cất khi một mô hình học hỏi từ một mô hình khác [và] loại bỏ kiến thức khỏi mô hình mẹ. Và có bằng chứng đáng kể cho thấy những gì DeepSeek đã làm ở đây là họ đã chưng cất kiến thức khỏi các mô hình của OpenAI. Và tôi không nghĩ OpenAI vui mừng về điều này” – ông Sack trả lời đài Fox News. Dù vậy, ông Sack cũng không đưa ra bằng chứng cụ thể.

Giữa tâm bão chỉ trích, DeepSeek dường như không lên tiếng về vấn đề này.

Tuy nhiên, “cuộc chiến” thực sự giữa hai công ty này dường như chỉ mới bắt đầu, khi cả hai liên tục ra mắt sản phẩm mới trong thời gian gần đây.

 Ông Sam Altman - CEO OpenAI. Ảnh: THE NEW YORK TIMES

Ông Sam Altman - CEO OpenAI. Ảnh: THE NEW YORK TIMES

Ngày 27-2, OpenAI đã phát hành phiên bản đầu tiên của GPT-4.5, được xem là mô hình AI lớn nhất từ trước đến nay của công ty này.

"Các cuộc thử nghiệm ban đầu cho thấy tương tác với GPT‑4.5 có cảm giác tự nhiên hơn. Cơ sở kiến thức rộng hơn, khả năng theo dõi ý định của người dùng được cải thiện và 'EQ' lớn hơn khiến mô hình này hữu ích cho các nhiệm vụ như cải thiện khả năng viết, lập trình và giải quyết các vấn đề thực tế" – OpenAi cho biết.

Tuy nhiên, chưa đầy 1 tháng sau, DeepSeek cũng cho ra sản phẩm mới. Ngày 25-3, DeepSeek đã phát hành bản nâng cấp lớn cho mô hình AI DeepSeek-V3, lấy tên DeepSeek-V3-0324. Theo hãng tin Reuters, mô hình mới nhất cho thấy những cải tiến đáng kể trong các lĩnh vực như khả năng lập luận và mã hóa so với phiên bản trước.

Nhiều nước lo ngại và chặn DeepSeek

Vào ngày 31-1, Cơ quan Hàng không Vũ trụ Mỹ (NASA) đã chặn DeepSeek khỏi hệ thống của cơ quan này và các thiết bị của nhân viên. Một tuần trước đó, Hải quân Mỹ cũng đã cảnh báo các thành viên trong lực lượng này không được sử dụng DeepSeek vì "những lo ngại tiềm ẩn về an ninh và đạo đức liên quan nguồn gốc, cách sử dụng mô hình này", đài CNBC đưa tin.

Ngày 5-2, phát ngôn viên của Bộ Thương mại, Công nghiệp và Năng lượng Hàn Quốc thông báo bộ này đã tạm thời cấm DeepSeek trên các thiết bị của nhân viên. Trước đó, ngày 31-1, Ủy ban Bảo vệ Thông tin Cá nhân Hàn Quốc cho biết họ sẽ gửi yêu cầu bằng văn bản tới DeepSeek để biết thông tin chi tiết về cách công ty này quản lý thông tin cá nhân của người dùng.

Đầu tháng 2, chính phủ Úc cũng cho biết họ đã chặn quyền truy cập vào DeepSeek trên tất cả thiết bị của chính phủ, với lý do có "rủi ro bảo mật". Bộ trưởng Bộ Nội vụ Úc Tony Burke cho biết lệnh cấm này là "để bảo vệ an ninh quốc gia và lợi ích quốc gia của Úc".

Ngày 30-1, Cơ quan Bảo vệ Dữ liệu Ý (Garante) đã thông báo rằng họ đã ra lệnh "hạn chế [DeepSeek] xử lý dữ liệu của người dùng Ý" vì thiếu thông tin về cách DeepSeek có thể sử dụng dữ liệu cá nhân do người dùng cung cấp.

HỒNG SƠN

Nguồn PLO: https://plo.vn/video/cuoc-canh-tranh-ngang-tai-ngang-suc-giua-deepseek-va-openai-post841055.html