DeepSeek V3.1 - át chủ bài cho tham vọng tự chủ chip AI của Trung Quốc

DeepSeek V3.1 thổi luồng lạc quan mới vào triển vọng Trung Quốc tự phát triển được chip trí tuệ nhân tạo (AI) tiên tiến, theo nhận định từ các nhà phân tích.

Ra mắt gần đây, mô hình DeepSeek V3.1 hỗ trợ một định dạng dữ liệu sáng tạo có tên UE8M0 FP8, “mở ra một chuỗi sức mạnh điện toán nội địa bùng nổ”, các nhà phân tích thuộc Huatai Securities viết trong một báo cáo nghiên cứu hôm 25.8.

Báo cáo cho biết kiến trúc này cho thấy sự cộng hưởng giữa phần mềm và chip do Trung Quốc thiết kế có thể mang lại những kết quả quan trọng.

FP8 (floating-point 8) là định dạng dữ liệu 8-bit, giảm độ chính xác nhằm tăng tốc độ huấn luyện và suy luận AI nhờ sử dụng ít bộ nhớ và băng thông hơn. UE8M0, một định dạng 8-bit khác, được cho là giúp tăng hiệu quả huấn luyện, giảm yêu cầu phần cứng khi có thể giảm tới 75% mức sử dụng bộ nhớ.

Định dạng dữ liệu UE8M0 FP8 của DeepSeek V3.1 được đánh giá là “trụ cột then chốt để xây dựng hệ sinh thái AI độc lập và có thể kiểm soát” cho Trung Quốc. Cường quốc châu Á đang thiết lập “hệ sinh thái lành mạnh cho sự phát triển đồng bộ của phần cứng, phần mềm và ứng dụng trong lĩnh vực tính toán AI”, theo báo cáo của Haitong Securities.

Huatai Securities là một trong những công ty chứng khoán hàng đầu Trung Quốc, được thành lập năm 1991, có trụ sở chính đặt tại thành phố Nam Kinh, tỉnh Giang Tô. Huatai Securities hoạt động trong nhiều lĩnh vực tài chính như môi giới chứng khoán, quản lý tài sản, ngân hàng đầu tư, nghiên cứu thị trường và các dịch vụ tài chính toàn diện khác.

Những đánh giá trên phản ánh nỗ lực ngày càng lớn của ngành AI và công nghiệp bán dẫn Trung Quốc nhằm thúc đẩy mục tiêu tự chủ công nghệ trong bối cảnh Mỹ siết chặt xuất khẩu công nghệ và căng thẳng địa chính trị gia tăng.

Diễn biến này diễn ra khi Trung Quốc bày tỏ lo ngại an ninh về các chip H20 của Nvidia. Tháng trước, một nhóm các công ty bán dẫn và AI Trung Quốc đã thành lập Liên minh Đổi mới Hệ sinh thái Mô hình-Chip nhằm thúc đẩy việc sử dụng bộ xử lý nội địa cho các dự án AI.

Định dạng dữ liệu UE8M0 FP8 của DeepSeek V3.1 được đánh giá là “trụ cột then chốt để xây dựng hệ sinh thái AI độc lập và có thể kiểm soát” cho Trung Quốc - Ảnh: Shutterstock

Định dạng dữ liệu UE8M0 FP8 của DeepSeek V3.1 được đánh giá là “trụ cột then chốt để xây dựng hệ sinh thái AI độc lập và có thể kiểm soát” cho Trung Quốc - Ảnh: Shutterstock

Bài đăng hôm 21.8 của DeepSeek trên WeChat, gợi ý rằng V3.1 được thiết kế đặc biệt “cho các chip AI nội địa thế hệ mới sắp ra mắt”, đã làm bùng lên sự quan tâm của các nhà đầu tư với các nhà phát triển chip AI trong nước, chẳng hạn Cambricon Technologies.

“Sự phát triển AI của Trung Quốc đang bước vào giai đoạn hợp tác giữa phần mềm và phần cứng, điều này có thể giảm đáng kể sự phụ thuộc vào sức mạnh điện toán từ nước ngoài”, nhà phân tích Mo Wenyu của Cinda Securities viết, đồng thời cho biết Cambricon Technologies hiện nằm trong danh sách các cổ phiếu “đáng chú ý”.

Cinda Securities là công ty chứng khoán Trung Quốc thuộc China Cinda Asset Management Co, một trong bốn công ty quản lý tài sản quốc doanh lớn nhất Trung Quốc. Cinda Securities hoạt động trong các lĩnh vực như môi giới chứng khoán, tư vấn tài chính, bảo lãnh phát hành, quản lý tài sản và nghiên cứu thị trường. Nhờ có hậu thuẫn từ China Cinda Asset Management Co, công ty này thường xuyên tham gia vào các báo cáo phân tích về kinh tế vĩ mô, ngành công nghiệp và các xu hướng tài chính - công nghệ mới ở Trung Quốc.

Các nhà cung cấp chip AI thế hệ mới cho DeepSeek được đồn đoán rộng rãi gồm Huawei, Moore Threads, Hygon Information Technology và MetaX Integrated Circuits. Một báo cáo của China Securities tuần trước nhấn mạnh Huawei là một trong những công ty tiềm năng nhất trong lĩnh vực bán dẫn AI.

“Gần đây, các sản phẩm máy chủ dựa trên chip Ascend của Huawei đã giành được nhiều đơn hàng lớn trong các ngành công nghiệp khác nhau, gồm chính phủ, tài chính và viễn thông”, China Securities cho biết. Báo cáo cũng nhấn mạnh hiệu quả chi phí của chip nội địa tiếp tục được cải thiện trong bối cảnh rủi ro ngày càng gia tăng từ chuỗi cung ứng nước ngoài.

Các công ty AI và chip Trung Quốc đang nâng cao vị thế trong nỗ lực tự cung tự cấp công nghệ của đất nước - Ảnh: Shutterstock

Các công ty AI và chip Trung Quốc đang nâng cao vị thế trong nỗ lực tự cung tự cấp công nghệ của đất nước - Ảnh: Shutterstock

Tuy nhiên, một số nhà phân tích cũng cảnh báo về những rủi ro tiềm ẩn với ngành bán dẫn Trung Quốc.

Những thách thức có thể bao gồm cuộc chiến thương mại Mỹ - Trung leo thang, sự phát triển 5G trong nước không đạt kỳ vọng và sự sụt giảm chi tiêu vốn của các nhà cung cấp dịch vụ đám mây Trung Quốc, theo các nhà phân tích thuộc Huatai Securities.

Huawei, Cambricon Technologies hay Moore Threads cung cấp chip AI thế hệ mới cho DeepSeek?

Trên mạng xuất hiện cuộc thảo luận về việc nhà cung cấp chip AI nào Trung Quốc sẽ tạo nên bước đột phá trong bối cảnh các hạn chế công nghệ từ Mỹ vẫn tiếp diễn.

Bài đăng hôm 21.8 của DeepSeek không nêu tên nhà cung cấp, cũng không chỉ rõ những chip AI mới sẽ được sử dụng để làm gì, huấn luyện mô hình hay suy luận (giai đoạn mà AI áp dụng những gì đã học vào thực tiễn).

Liu Jie, kỹ sư tại một hãng phát triển GPU (bộ xử lý đồ họa) có trụ sở ở thành phố Thượng Hải, dự đoán: “Có khả năng V3.1 sẽ hỗ trợ nhiều loại chip AI, không chỉ chip Huawei hay một công ty khác”.

“Kiến trúc FP8 được thiết kế đặc biệt để phù hợp với logic phần cứng của chip Trung Quốc, cho phép mô hình AI chạy mượt trên phần cứng này”, Su Lian Jye, nhà phân tích chính tại công ty nghiên cứu Omdia, nhận định.

Su Lian Jye bổ sung rằng các chip Trung Quốc hiện có khả năng hỗ trợ FP8 gồm sản phẩm của Huawei HiSilicon, Cambricon Technologies, MetaX và Moore Threads.

Trong một bài đăng trên WeChat hôm 23.8, viện nghiên cứu Zhitan AI (Trung Quốc) cho biết chip Huawei 910D và Siyuan 690 của Cambricon Technologies có thể sẽ được sử dụng cho DeepSeek V3.1.

Những đánh giá đó đã làm dấy lên suy đoán rằng một số nhà thiết kế chip nội địa có thể giành thị phần trong nước từ Nvidia (Mỹ), vốn đang phải đối mặt với sự giám sát chặt chẽ hơn từ các cơ quan quản lý Trung Quốc.

Giới chức nước này gần đây bày tỏ lo ngại về việc chip H20, vừa được Mỹ cho phép bán trở lại cho khách hàng Trung Quốc sau một thời gian tạm dừng, có thể gây rủi ro an ninh mạng, điều mà Nvidia bác bỏ.

Thậm chí một số cơ quan Trung Quốc như Cục Quản lý Không gian mạng (CAC), Ủy ban Cải cách và Phát triển Quốc gia (NDRC) và Bộ Công nghiệp và Công nghệ Thông tin (MIIT) tìm cách hạn chế doanh nghiệp công nghệ trong nước mua chip AI Nvidia, theo hai nguồn tin của FT.

Dẫu vậy, Su Lian Jye dự báo DeepSeek sẽ tiếp tục gặp thách thức với chip AI thế hệ mới của Trung Quốc trong ngắn hạn.

“Đội ngũ DeepSeek luôn sử dụng chip Nvidia để phát triển mô hình của mình. Vì vậy, không có gì ngạc nhiên khi quá trình chuyển đổi sang chip AI Trung Quốc đã gặp phải những thách thức về tính ổn định, tốc độ kết nối và hệ sinh thái phần mềm”, Su Lian Jye nhận định.

Gần đây, trang FT đưa tin DeepSeek phải hoãn phát hành mô hình suy luận R2 vì cố dùng chip AI Ascend của Huawei thay Nvidia.

Theo FT, DeepSeek gặp phải các vấn đề kỹ thuật kéo dài trong quá trình huấn luyện R2 bằng chip AI Ascend. Điều đó buộc công ty phải dùng chip AI Nvidia cho giai đoạn huấn luyện và chip Huawei ở giai đoạn suy luận, các nguồn tin cho biết.

Mô hình lai

Hôm 21.8, DeepSeek tiết lộ V3.1 hỗ trợ cả chế độ suy luận và không suy luận, đánh dấu bước đầu tiên hướng tới kỷ nguyên tác tử AI của công ty. Đây là động thái cho thấy sự thay đổi của DeepSeek trong trọng tâm nghiên cứu.

Tác tử AI là hệ thống có khả năng nhận thức, lập kế hoạch và thực hiện các hành động độc lập để đạt được mục tiêu. Ví dụ, tác tử AI có thể tự động tìm kiếm thông tin trên internet, tổng hợp dữ liệu, và thực hiện các tác vụ phức tạp mà không cần sự can thiệp liên tục từ người dùng.

Chế độ suy luận trên chatbot cùng tên DeepSeek trước đó được vận hành bởi R1, từng gây chú ý toàn cầu sau khi ra mắt vào tháng 1, ngay sau khi mô hình nền tảng V3 được giới thiệu hồi tháng 12.2024.

Trong khi V3.1 (bản nâng cấp cho V3) áp dụng cách tiếp cận “một mô hình, hai chế độ”, cho thấy DeepSeek có thể sẽ không phát triển R2 - phiên bản kế nhiệm mô hình suy luận R1.

DeepSeek tuyên bố V3.1 đưa ra câu trả lời nhanh hơn R1, vốn được cập nhật lần gần nhất vào cuối tháng tháng 5 qua phiên bản R1-0528.

Được mở rộng cửa sổ ngữ cảnh lên 128k, V3.1 có khả năng lưu giữ nhiều thông tin hơn trong các cuộc trò chuyện với người dùng, tương đương cuốn sách khoảng 300 trang.

Một số thử nghiệm bên thứ ba cho thấy V3.1 đã cải thiện khả năng lập trình.

Theo Aider Benchmark - bộ đánh giá khả năng lập trình của mô hình AI, DeepSeek V3.1 đứng đầu trong số các hệ thống Trung Quốc. Song khi so với các đối thủ quốc tế, V3.1 vẫn xếp sau Claude Opus 4, vốn được công nhận là một trong những mô hình AI lập trình tốt nhất hiện nay.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/deepseek-v3-1-at-chu-bai-cho-tham-vong-tu-chu-chip-ai-cua-trung-quoc-236746.html