DeepSeek phải hoãn ra mắt mô hình R2 vì dùng chip AI Huawei thay Nvidia

Khó khăn khi huấn luyện mô hình AI mới nhất R2 của DeepSeek (Trung Quốc) bằng chip Huawei cho thấy sự phụ thuộc vào Nvidia.

Công ty trí tuệ nhân tạo (AI) DeepSeek phải hoãn phát hành R2 sau khi không thể huấn luyện mô hình suy luận này bằng chip Huawei, trang FT đưa tin. Điều này chỉ ra những giới hạn trong nỗ lực của Trung Quốc nhằm thay thế công nghệ Mỹ.

Sau khi ra mắt mô hình suy luận mã nguồn mở R1 vào tháng 1 và gây tiếng vang toàn cầu, DeepSeek đã được chính quyền Trung Quốc khuyến khích sử dụng chip AI Ascend của Huawei thay vì sản phẩm Nvidia, theo ba nguồn tin của FT am hiểu sự việc.

Tuy nhiên, DeepSeek gặp phải các vấn đề kỹ thuật kéo dài trong quá trình huấn luyện R2 bằng chip AI Ascend. Điều đó buộc công ty có trụ sở ở thành phố Hàng Châu phải dùng chip AI Nvidia cho giai đoạn huấn luyện và chip Huawei ở giai đoạn suy luận, các nguồn tin cho biết.

Theo một người am hiểu tình hình, những vấn đề này là lý do chính khiến việc ra mắt R2 bị lùi lại từ tháng 5, khiến DeepSeek mất lợi thế trước các đối thủ.

Huấn luyện là giai đoạn mô hình AI học từ một tập dữ liệu lớn. Suy luận là bước sử dụng mô hình AI đã được huấn luyện để đưa ra dự đoán hoặc tạo phản hồi, chẳng hạn trả lời câu hỏi thông qua chatbot.

Những khó khăn của DeepSeek cho thấy chip Trung Quốc vẫn tụt hậu so với đối thủ Mỹ, đặc biệt là Nvidia (hãng chip AI số 1 thế giới), ở các tác vụ quan trọng, phản ánh thách thức mà cường quốc châu Á phải đối mặt trong mục tiêu tự chủ công nghệ.

DeepSeek gặp phải các vấn đề kỹ thuật kéo dài trong quá trình huấn luyện R2 bằng chip AI Ascend của Huawei - Ảnh: FT

DeepSeek gặp phải các vấn đề kỹ thuật kéo dài trong quá trình huấn luyện R2 bằng chip AI Ascend của Huawei - Ảnh: FT

Gần đây, trang FT đưa tin Trung Quốc đã yêu cầu các hãng công nghệ nước này giải trình các đơn đặt hàng chip H20 của Nvidia, nhằm khuyến khích họ sử dụng sản phẩm thay thế của Huawei và Cambricon.

Theo giới chuyên gia trong ngành, chip Trung Quốc gặp vấn đề về độ ổn định, tốc độ kết nối giữa các chip chậm hơn và phần mềm kém hơn so với sản phẩm của Nvidia.

"Không thể một lần huấn luyện R2 thành công trên chip Ascend"

Hai nguồn tin cho biết Huawei đã cử một nhóm kỹ sư tới văn phòng DeepSeek để hỗ trợ sử dụng chip AI của hãng nhằm phát triển R2. Tuy nhiên, dù có đội hỗ trợ tại chỗ, DeepSeek vẫn không thể thực hiện thành công một lần huấn luyện R2 trên chip Ascend, theo FT.

Các nguồn tin của FT nói thêm rằng DeepSeek vẫn đang hợp tác với Huawei để giúp R2 tương thích với chip Ascend trong giai đoạn suy luận.

Những nguồn tin này cũng cho biết Lương Văn Phong (nhà sáng lập kiêm Giám đốc điều hành DeepSeek) đã bày tỏ sự không hài lòng với tiến độ của R2 và đang thúc ép nhân viên dành thêm thời gian để xây dựng một mô hình AI tiên tiến hơn, có thể duy trì vị thế hàng đầu của công ty trong lĩnh vực AI ở Trung Quốc.

Việc ra mắt R2 bị chậm lại còn do quá trình gán nhãn dữ liệu cho R2 mất nhiều thời gian hơn dự kiến, theo một nguồn tin khác của FT. Truyền thông Trung Quốc loan tin DeepSeek có thể tung ra R2 trong vài tuần tới.

R2 được mong đợi là bản nâng cấp đáng kể cho R1 - mô hình từng gây sốt toàn cầu đầu năm nay khi đạt hiệu suất ngang ngửa các sản phẩm Mỹ như của OpenAI, Google và Anthropic nhưng được đào tạo với chi phí thấp hơn rất nhiều lần.

Qwen3 của Alibaba tăng tốc khi DeepSeek chậm phát hành R2, Huawei cần thêm thời gian

“Các mô hình AI là loại sản phẩm có thể dễ dàng bị thay thế. Nhiều nhà phát triển đang dùng Qwen3 của Alibaba, vốn mạnh mẽ và linh hoạt”, Ritwik Gupta, nhà nghiên cứu AI tại Đại học California – Berkeley (Mỹ), nhận xét.

Ritwik Gupta lưu ý rằng Qwen3 áp dụng các khái niệm cốt lõi của DeepSeek, chẳng hạn thuật toán huấn luyện giúp mô hình AI có khả năng suy luận, nhưng đã làm cho chúng hiệu quả hơn khi sử dụng.

Theo dõi hệ sinh thái AI của Huawei, Ritwik Gupta cho rằng hãng công nghệ hàng đầu Trung Quốc này đang phải đối mặt với "những khó khăn ban đầu" khi sử dụng chip Ascend để đào tạo mô hình. Thế nhưng, ông tin Huawei sẽ thích nghi theo thời gian.

“Việc hiện tại chưa thấy các mô hình AI hàng đầu được huấn luyện trên chip Huawei không có nghĩa điều đó sẽ không xảy ra trong tương lai. Vấn đề chỉ là thời gian”, Ritwik Gupta nhận xét.

Trung Quốc nghi ngại Nvidia H20 có cửa hậu

Nvidia, hãng chip AI đang ở trung tâm cuộc đối đầu địa chính trị Trung - Mỹ, gần đây đã đồng ý chia sẻ một phần doanh thu tại Trung Quốc với chính phủ Mỹ để có thể nối lại việc bán chip H20 cho Trung Quốc.

H20 là chip AI trung tâm dữ liệu mạnh nhất hiện nay của Nvidia dành cho thị trường Trung Quốc, chuyên dùng huấn luyện các mô hình.

“Các nhà phát triển sẽ đóng vai trò then chốt trong việc xây dựng hệ sinh thái AI chiến thắng. Từ bỏ toàn bộ thị trường cùng các nhà phát triển Trung Quốc chỉ làm tổn hại tới kinh tế và an ninh quốc gia Mỹ”, Nvidia nói về các công ty Trung Quốc đang dùng chip của hãng.

Chính quyền Trump đã can thiệp mạnh vào giới kinh doanh, đặc biệt là thị trường chất bán dẫn, khi Mỹ cạnh tranh với Trung Quốc để giành ưu thế về AI.

Cuối tuần qua, Nvidia đã đồng ý trả cho chính phủ liên bang Mỹ 15% doanh thu để đổi lấy giấy phép kiểm soát xuất khẩu, cho phép hãng tiếp tục bán chip H20 sang Trung Quốc. Ông Jensen Huang (Giám đốc điều hành Nvidia) đã đến gặp Tổng thống Donald Trump tại Nhà Trắng hôm 8.8.

Ngày 11.8, Tổng thống Trump kể rằng ban đầu ông yêu cầu Nvidia trả 20% doanh thu từ thị trường Trung Quốc, nhưng con số này giảm xuống 15% sau khi thương lượng với Jensen Huang .

Theo một số nguồn tin, AMD cũng phải trả chính phủ liên bang Mỹ 15% doanh thu để bán chip AI MI308 sang Trung Quốc.

Nvidia khẳng định H20 không có công tắc hủy hoặc cửa hậu - Ảnh: Internet

Nvidia khẳng định H20 không có công tắc hủy hoặc cửa hậu - Ảnh: Internet

Cuối tháng 7, Cơ quan Quản lý Không gian mạng Trung Quốc (CAC) đã triệu tập Nvidia để bày tỏ lo ngại về nguy cơ chip AI H20 có chứa “cửa hậu” cho phép truy cập hoặc kiểm soát từ xa, điều mà công ty Mỹ phủ nhận.

Ngày 31.7, CAC thông báo đã triệu tập Nvidia để xác định liệu H20 ty có rủi ro bảo mật nào không. Cơ quan quản lý internet Trung Quốc lo ngại dữ liệu và quyền riêng tư người dùng nước này có thể bị ảnh hưởng nếu H20 tồn tại "chức năng theo dõi và điều khiển từ xa tiềm ẩn", theo tờ New York Times.

"Để bảo vệ mạng lưới và an ninh dữ liệu của người dùng, chúng tôi đã yêu cầu công ty giải thích các rủi ro cửa hậu liên quan đến H20 bán cho Trung Quốc và nộp bằng chứng hỗ trợ", CAC nêu.

Hôm 5.8, ông David Reber, Giám đốc an ninh Nvidia, viết trong một bài đăng blog rằng: “GPU (bộ xử lý đồ họa) của Nvidia không và không nên có công tắc hủy hoặc cửa hậu”.

David Reber lập luận các cửa hậu bí mật là những lỗ hổng nguy hiểm có thể bị hacker lẫn giới chức khai thác, rằng chúng “vi phạm các nguyên tắc cơ bản của an ninh mạng”.

Ông cũng cho rằng nếu công tắc hủy (chức năng vô hiệu hóa chip từ xa) hoặc cửa hậu được tích hợp vào các sản phẩm như GPU Nvidia, điều đó sẽ gây tổn hại đến lợi ích an ninh quốc gia Mỹ.

"Việc cài công tắc hủy vào chip là một điều hoàn toàn khác: Một lỗ hổng ngoài tầm kiểm soát của người dùng và là lời mời công khai cho thảm họa. Nó giống như mua ô tô mà đại lý vẫn giữ điều khiển từ xa cho phanh đỗ xe (phanh khẩn cấp), phòng trường hợp họ quyết định rằng bạn không nên lái xe", David Reber viết.

Tuyên bố trên cho thấy cách Nvidia đang phải điều hướng xung đột địa chính trị trong bối cảnh chip AI của hãng vẫn rất được các quốc gia và doanh nghiệp trên toàn thế giới săn đón.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/deepseek-phai-hoan-ra-mat-mo-hinh-r2-vi-dung-chip-ai-huawei-thay-nvidia-236209.html