DeepSeek hé lộ chip AI thế hệ mới của Trung Quốc có thể sớm ra mắt
Hôm thứ Năm (21/8), công ty khởi nghiệp trí tuệ nhân tạo DeepSeek cho biết, Trung Quốc sẽ sớm có chip 'thế hệ tiếp theo' nội địa để hỗ trợ các mô hình AI, đồng thời công bố bản cập nhật cho một trong những mô hình ngôn ngữ lớn của mình.

DeepSeek cho biết định dạng độ chính xác "UE8M0 FP8" của mô hình V3.1 mới phát hành được thiết kế riêng cho các chip thế hệ tiếp theo do Trung Quốc sản xuất sẽ được sớm ra mắt.
Trong đó, FP8 hay “floating-point 8” là một định dạng xử lý dữ liệu 8-bit có thể tăng cường hiệu quả tính toán cho việc đào tạo và suy luận các mô hình học sâu lớn. UE8M0 là một biến thể với 8 bit cho số mũ và 0 bit cho phần trị, có thể nâng cao hơn nữa hiệu quả huấn luyện, từ đó giảm yêu cầu phần cứng vì có thể cắt giảm tới 75% lượng bộ nhớ cần thiết.
Việc DeepSeek sử dụng các định dạng này, nếu kết hợp với chip nội địa của Trung Quốc, có thể tạo ra một bước đột phá mới trong việc phối hợp phần cứng và phần mềm.
Bên cạnh đó, động thái DeepSeek đề cập đến chip thế hệ tiếp theo sắp ra mắt của Trung Quốc có thể báo hiệu kế hoạch hợp tác chặt chẽ hơn với hệ sinh thái chip AI mới nổi của nước này trong bối cảnh Mỹ đang áp dụng các hạn chế xuất khẩu chất bán dẫn tiên tiến và các nhà chức trách Trung Quốc đang thúc đẩy tự cung cấp chip.
Trong khi các nhà phân tích cho rằng các nhà sản xuất chip AI nội địa của Trung Quốc đã tụt hậu so với Nvidia về mặt tiến bộ công nghệ và quy mô, thì những công ty như Huawei đã và đang đạt được những tiến bộ.
Tuy nhiên, DeepSeek không tiết lộ loại chip mà họ sử dụng để đào tạo mô hình V3.1, hay UE8M0 FP8 có thể tương thích với loại chip nội địa nào.
Đầu năm nay, DeepSeek đã gây chấn động thế giới công nghệ sau khi phát hành mô hình suy luận R1, mô hình này chứng minh được khả năng tương đương với các đối thủ phương Tây như OpenAI, bất chấp việc các biện pháp kiểm soát xuất khẩu của Mỹ hạn chế công ty sử dụng các chip đào tạo AI tiên tiến nhất của Nvidia.
Trước đó, vào tháng 12, DeepSeek đã phát hành mô hình V3, được cho là đã được đào tạo trên khoảng 2.000 chip kém tiên tiến hơn của Nvidia.
Sau những đột phá về mô hình của DeepSeek, Mỹ đã tăng cường thắt chặt các biện pháp hạn chế xuất khẩu chip vào tháng 4, trong đó đã cấm các chip H20 của Nvidia - vốn được thiết kế đặc biệt để đáp ứng các hạn chế xuất khẩu trước đó đối với Trung Quốc.
Tháng trước, các quan chức Nhà Trắng cho biết họ có kế hoạch cho phép Nvidia tiếp tục vận chuyển chip sang Trung Quốc. Tuy nhiên, chip H20 hiện đang bị giám sát chặt chẽ tại Trung Quốc vì các cơ quan quản lý được cho là đã yêu cầu các công ty không mua chip cho đến khi hoàn tất đánh giá an ninh quốc gia.
Các nhà phân tích chip cho rằng Huawei, vốn đang tìm cách xây dựng một hệ sinh thái chip AI thay thế tại Trung Quốc, có thể được hưởng lợi từ việc thiếu vắng chip H20 của Nvidia trên thị trường.
Bên cạnh đó, DeepSeek cho biết mô hình V3.1 đi kèm với những thay đổi lớn, bao gồm thời gian phản hồi nhanh hơn và kiến trúc lập luận lai cho phép mô hình hỗ trợ cả chế độ lập luận và phi lập luận. Các mô hình lập luận có thể thực hiện các tác vụ phức tạp hơn thông qua quy trình suy luận logic từng bước.
Bắt đầu từ ngày 6/9, DeepSeek cũng sẽ điều chỉnh giá sử dụng API của mô hình này, cho phép các nhà phát triển ứng dụng và sản phẩm web khác tích hợp DeepSeek trên nền tảng của họ.