DeepSeek đang thay đổi cuộc chơi AI toàn cầu như thế nào?

Sự xuất hiện của DeepSeek đang khiến giới công nghệ toàn cầu phải kinh ngạc về sự thông minh, tính hiệu quả dù mức chi phí vận hành và đầu tư ban đầu thấp hơn nhiều so với các công cụ AI khác hiện nay.

DeepSeek, một công ty khởi nghiệp của Trung Quốc được thành lập từ năm 2023, bởi ông Liang Wenfeng sinh năm 1985, tốt nghiệp cử nhân và thạc sĩ ngành kỹ thuật điện tử và thông tin tại Đại học Chiết Giang (Zhejiang University).

Giống như nhiều startup AI khác, DeepSeek từng thử nghiệm và phát triển nhiều mô hình AI, nhưng chưa thực sự gây chú ý. Chỉ đến khi ra mắt mô hình DeepSeek R1 vào cuối năm ngoái và chính thức đưa vào sử dụng trên phạm vi toàn cầu từ ngày 20/1/2025, công ty mới thực sự tạo nên “cơn sốt” trên toàn cầu.

Ông Liang Wenfeng - nhà sáng lập DeepSeek. Ảnh: Theo South China Morning Post.

Ông Liang Wenfeng - nhà sáng lập DeepSeek. Ảnh: Theo South China Morning Post.

Ngay sau khi phát hành rộng rãi R1, ứng dụng DeepSeek đạt 22,15 triệu người dùng hàng ngày tính đến 31/1/2025, vượt qua con số 16,95 triệu người dùng của Doubao từ ByteDance. Còn số người dùng ChatGPT vào thời điểm trên là 53,23 triệu người dùng.

Mặc dù chưa bằng một nửa số người dùng hàng ngày so với sản phẩm của OpenAI, DeepSeek được cho là ứng dụng AI có tốc độ phát triển nhanh nhất. Các phiên bản ứng dụng cho hệ điều hành Android và iOS của sản phẩm này ra mắt lần lượt vào ngày 8 và 10/1/2025, từ con số 0 đã đạt trên mức 20 triệu người dùng chỉ sau gần 20 ngày. Trong khi đó, vào cuối năm 2022, ChatGPT ra mắt thu hút khoảng 1,46 triệu người dùng trong cùng khoảng thời gian.

Dù tuổi đời ngắn, sức mạnh của DeepSeek R1 đã có thể sánh ngang hoặc thậm chí vượt trội so với những mô hình AI nổi tiếng như ChatGPT của OpenAI, Gemini của Google, CoPilot của Microsoft hay Llama của Meta…

Ông Marc Andreessen, nhà đầu tư công nghệ nổi tiếng và là đồng sáng lập công ty đầu tư mạo hiểm Andreessen Horowitz tại Thung lũng Silicon nhận định: “DeepSeek R1 là một trong những bước đột phá đáng kinh ngạc và ấn tượng nhất mà tôi từng thấy”.

Mô hình AI của DeepSeek có gì nổi bật?

Theo TechCrunch, DeepSeek R1 là một mô hình ngôn ngữ lớn (LLM) áp dụng kỹ thuật Inference-time compute (Tính toán thời gian suy luận). Điều này có nghĩa là thay vì truy xuất toàn bộ dữ liệu từ hệ thống khổng lồ, DeepSeek chỉ kích hoạt những phần liên quan nhất để đưa ra câu trả lời cho mỗi truy vấn. Nhờ đó, mô hình này có tốc độ phản hồi nhanh hơn và tiết kiệm đáng kể chi phí vận hành.

Đáng chú ý, DeepSeek còn là một mô hình mã nguồn mở, cho phép các công ty tích hợp vào sản phẩm của họ và nhận sự đóng góp từ cộng đồng để tiếp tục phát triển.

Nhiều chuyên gia và người dùng đánh giá R1 có phản hồi nhanh hơn, chính xác hơn so với các công cụ AI đình đám như ChatGPT của OpenAI, Gemini của Google hay Llama của Meta. Ảnh: New York Times.

Nhiều chuyên gia và người dùng đánh giá R1 có phản hồi nhanh hơn, chính xác hơn so với các công cụ AI đình đám như ChatGPT của OpenAI, Gemini của Google hay Llama của Meta. Ảnh: New York Times.

Về hiệu suất, DeepSeek R1 đạt kết quả ấn tượng trên nhiều bảng đánh giá quan trọng, ngang bằng hoặc thậm chí vượt qua các đối thủ. Cụ thể, mô hình này đạt điểm cao trên AIME 2024 (bài toán), MMLU (kiến thức tổng quát) và AlpacaEval 2.0 (khả năng hỏi đáp). Đặc biệt, R1 cũng nằm trong nhóm dẫn đầu trên bảng xếp hạng Chatbot Arena do UC Berkeley quản lý.

Nhiều chuyên gia và người dùng đánh giá R1 có phản hồi nhanh hơn, chính xác hơn so với các công cụ AI đình đám như ChatGPT của OpenAI, Gemini của Google hay Llama của Meta. Thậm chí, trong một số bài kiểm tra, mô hình DeepSeek R1 được cho là ngang bằng hoặc vượt qua mô hình AI tiên tiến o1 của OpenAI.

DeepSeek ảnh hưởng thế nào đến các công ty công nghệ Mỹ?

Theo CNN, điểm đặc biệt của DeepSeek R1 chỉ tiêu tốn khoảng 5,6 triệu USD để xây dựng và vận hành. Trong khi đó các tập đoàn công nghệ Mỹ như Meta có kế hoạch chi 65 tỷ USD trong năm nay để phát triển AI. Ngay cả CEO OpenAI là ông Sam Altman từng tuyên bố rằng, ngành AI có thể cần hàng nghìn tỷ USD để đầu tư vào chip AI phục vụ các trung tâm dữ liệu.

Do đó, việc DeepSeek đạt được hiệu suất gần bằng các mô hình AI hàng đầu với chi phí chỉ vài triệu USD đang làm thay đổi cách nhìn của cả ngành về mức đầu tư cần thiết cho AI.

Nhà sản xuất chip NVIDIA từng là cái tên hưởng lợi nhiều nhất từ cuộc đua AI, khi các hãng công nghệ chi hàng tỷ USD để mua chip xử lý AI cho hệ thống máy chủ của mình. Tuy nhiên, sự xuất hiện của DeepSeek đang tạo ra thách thức lớn cho NVIDIA.

Với khả năng vận hành trên phần cứng có hiệu suất thấp hơn, DeepSeek làm dấy lên lo ngại về nhu cầu chip cao cấp trong tương lai. Điều này đã tác động mạnh đến thị trường, khiến cổ phiếu NVIDIA giảm hơn 20%, làm vốn hóa công ty "bốc hơi" hơn 600 tỷ USD chỉ trong một ngày, điển hình là ngày 27/1 vừa qua.

Thực tế, mô hình AI của DeepSeek đang tác động trực tiếp đến quyền lợi của các tập đoàn công nghệ hàng đầu thế giới. Ngay sau khi DeepSeek công bố “AI giá rẻ”, nhiều tỷ phú có tài sản liên quan đến trí tuệ nhân tạo cũng ít nhiều bị ảnh hưởng. Chẳng hạn, CEO NVIDIA Jensen Huang chứng kiến tài sản giảm 20,1 tỷ USD, tài sản của nhà sáng lập Oracle Larry Ellison giảm 22,6 tỷ USD, CEO Michael Dell mất 13 tỷ USD hay nhà đồng sáng lập Binance là ông Changpeng Zhao “bốc hơi” 12,1 tỷ USD tài sản.

Sự trỗi dậy của AI tạo sinh như ChatGPT đã châm ngòi cho cuộc chạy đua vũ trang giữa các tập đoàn công nghệ như Meta, Microsoft và Google. Họ tin rằng chìa khóa thành công nằm trong việc sở hữu nguồn lực điện toán khổng lồ để vận hành các mô hình AI tiên tiến. Tuy nhiên, quan niệm này đang bị lung lay kể từ thời điểm DeepSeek phát hành những mô hình AI mới hiệu suất cao với chi phí đào tạo thấp đến bất ngờ.

Hà Anh

Nguồn Mekong Asean: https://mekongasean.vn/deepseek-dang-thay-doi-cuoc-choi-ai-toan-cau-nhu-the-nao-38109.html