Bí mật đằng sau làn sóng 'AI giá rẻ' DeepSeek hứa hẹn sẽ làm nóng thêm cuộc đua công nghệ toàn cầu

Sự ra đời của R1 đánh dấu một cột mốc mới trong ngành AI, khi một mô hình mã nguồn mở, hiệu năng cao mà chi phí lại cực thấp có thể cạnh tranh sòng phẳng với các sản phẩm thương mại đắt đỏ từ Mỹ.

DeepSeek - công ty khởi nghiệp AI tại Trung Quốc, vừa gây bão trên thị trường công nghệ toàn cầu sau khi ra mắt mô hình ngôn ngữ lớn (LLM) mang tên R1. Sự kiện này không chỉ gây hoang mang cho giới đầu tư, khiến chỉ số chứng khoán Mỹ lao dốc, mà còn báo hiệu những lo ngại sâu sắc về làn sóng "AI giá rẻ" của DeepSeek đối với ngành công nghệ Mỹ.

Bên cạnh việc cải tiến phần mềm để tối ưu hóa quá trình huấn luyện và vận hành mô hình AI, DeepSeek đã tạo bước đột phá về phần cứng khi sử dụng chip Ascend 910C của Huawei cho các tác vụ suy luận (inference), trong khi vẫn duy trì việc sử dụng GPU NVIDIA H800 cho quá trình huấn luyện.

Không chỉ tìm ra được cách tối ưu phần mềm để đạt được hiệu suất cao trong quá trình huấn luyện và phát triển mô hình AI, DeepSeek còn tìm được một đột phá khác về phần cứng để vận hành mô hình AI của mình với mức giá rẻ không tưởng so với các đối thủ Mỹ - đó là dùng chip máy chủ của Huawei.

DeepSeek R1 đang chạy các tác vụ suy luận (inference) trên chip Ascend 910C của Huawei, dù vẫn dựa vào GPU NVIDIA H800 để huấn luyện. Đáng chú ý, Ascend 910C được coi là đối thủ cạnh tranh trực tiếp với bộ tăng tốc AI Hopper H100 của NVIDIA. Mặc dù thông số kỹ thuật của con chip này chưa được công bố chi tiết, nhưng Huawei được cho là đã lên kế hoạch sản xuất hàng loạt từ quý I/2025, thu hút sự quan tâm từ các ông lớn AI trong nước như ByteDance và Tencent.

Việc kết hợp phần cứng nội địa và công nghệ tối ưu giúp DeepSeek R1 giảm đáng kể chi phí vận hành. Trong khi OpenAI tính phí 15 USD cho mỗi triệu token đầu vào, DeepSeek chỉ cần 0,55 USD – mức giá cách biệt khiến các đối thủ phương Tây khó lòng cạnh tranh.

Hơn nữa, mô hình này hoàn toàn miễn phí và không giới hạn người dùng, một yếu tố then chốt giúp ứng dụng chatbot của hãng vượt mặt ChatGPT để trở thành ứng dụng được tải nhiều nhất tại Mỹ chỉ sau vài tuần ra mắt.

Các sản phẩm AI của Huawei ngày càng được xem là giải pháp thay thế hàng đầu cho phần cứng Nvidia tại Trung Quốc. Sự phổ biến của chip Ascend 910C không chỉ đến từ giá thành cạnh tranh mà còn từ khả năng cung ứng nội địa với số lượng lớn, đặc biệt trong bối cảnh các thiết bị từ nước ngoài bị hạn chế bởi lệnh cấm vận.

Về mặt tài chính, thông tin "5 triệu USD" được đưa ra không phải là tổng chi phí huấn luyện mô hình R1, mà chỉ là chi phí để vận hành mô hình sau khi hoàn thiện. Một số báo cáo còn cho rằng DeepSeek đang sử dụng hơn 50.000 GPU H100 của Nvidia, cho thấy công ty vẫn cần nguồn lực tương đương các đối thủ AI khác. Tuy vậy, việc triển khai chip Ascend 910C cho các tác vụ suy luận vẫn là một nước đi đầy táo bạo, chứng minh khả năng vượt qua những hạn chế về phần cứng nhập khẩu.

Dù vậy, việc dùng chip Ascend 910C của Huawei cho inference vẫn là một bước đi ấn tượng. DeepSeek R1 tận dụng được lợi thế về giá và sự sẵn có của chip nội địa, trong bối cảnh trước đó phải dựa vào phần cứng nước ngoài khan hiếm và đắt đỏ do lệnh cấm vận. Huawei được cho là đang phát triển thế hệ chip AI Ascend tiếp theo, nhằm cạnh tranh với sản phẩm Blackwell AI của NVIDIA, hứa hẹn sẽ làm nóng thêm cuộc đua công nghệ toàn cầu.

Sự ra đời của R1 đánh dấu một cột mốc mới trong ngành AI, khi một mô hình mã nguồn mở, hiệu năng cao mà chi phí lại cực thấp có thể cạnh tranh sòng phẳng với các sản phẩm thương mại đắt đỏ từ Mỹ.

Với chi phí thấp và hiệu năng cao, mô hình này đã phá vỡ thế độc quyền của các sản phẩm đắt đỏ từ phương Tây, đưa AI đến gần hơn với người dùng. Có thể nói, ngành trí tuệ nhân tạo đang chứng kiến sự chuyển giao quyền lực từ các ông lớn phương Tây sang những 'tay chơi' mới đến từ Trung Quốc.

Linh An

Nguồn Doanh nhân & Pháp luật: https://doanhnhan.vn/bi-mat-dang-sau-lan-song-ai-gia-re-deepseek-hua-hen-se-lam-nong-them-cuoc-dua-cong-nghe-toan-cau-80454.html