Mô hình AI của DeepSeek ra mắt phiên bản nâng cấp với chip nội địa
Hôm 21/8, Reuters đưa tin công ty khởi nghiệp trí tuệ nhân tạo (AI) của Trung Quốc DeepSeek đã ra mắt phiên bản nâng cấp cho mô hình AI hàng đầu có tên V3 của mình. Công ty cho biết phiên bản này có một tính năng có thể tối ưu hóa cho chip sản xuất tại Trung Quốc, cùng với tốc độ xử lý nhanh hơn.
Việc tập trung vào khả năng tương thích với chip nội địa cho thấy các mô hình AI của DeepSeek đang được định vị để hoạt động với hệ sinh thái bán dẫn mới nổi của Trung Quốc trong bối cảnh Bắc Kinh đang nỗ lực thay thế công nghệ của Mỹ trước các hạn chế xuất khẩu của Washington.
DeepSeek đã làm chấn động thế giới công nghệ năm nay khi phát hành các mô hình AI cạnh tranh với các mô hình AI của Phương Tây như ChatGPT của OpenAI với chi phí vận hành thấp hơn nhưng không hề thua kém về tính năng.
Việc nâng cấp lên mô hình V3 của DeepSeek diễn ra sau hai bản cập nhật gần đây khác cho các mô hình AI cốt lõi của hãng gồm bản cập nhật mô hình R1 vào tháng 5 và bản nâng cấp V3 trước đó vào tháng 3.

Deepseek đang cải tiến mô hình AI của mình
Về khả năng hỗ trợ chip trong nước, DeepSeek cho biết trong một bài đăng trên mạng xã hội WeChat rằng định dạng chính xác UE8M0 FP8 của mô hình DeepSeek-V3.1 được tối ưu hóa cho "các chip nội địa thế hệ tiếp theo sắp ra mắt".
Công ty không tiết lộ cụ thể các mẫu chip hoặc nhà sản xuất nào sẽ được hỗ trợ.
FP8 là một định dạng xử lý dữ liệu cho phép các mô hình AI hoạt động hiệu quả hơn, sử dụng ít bộ nhớ hơn trong khi vẫn chạy nhanh hơn các phương pháp truyền thống.
DeepSeek-V3.1 có cấu trúc suy luận lai cho phép mô hình hoạt động ở cả chế độ suy luận và phi suy luận. Người dùng có thể chuyển đổi giữa các chế độ này bằng nút "suy nghĩ sâu" trên ứng dụng và nền tảng web chính thức của công ty, cả hai đều đang chạy phiên bản V3.1.
Công ty cũng sẽ điều chỉnh chi phí sử dụng API của mô hình, một nền tảng cho phép các nhà phát triển ứng dụng và sản phẩm web khác tích hợp các mô hình AI của mình, bắt đầu từ ngày 6/9.