DeepSeek ra mắt phiên bản mới có thể ghi nhớ lượng văn bản khổng lồ

Với phiên bản xem trước mã nguồn mở, DeepSeek V4 gây ấn tượng mạnh mẽ nhờ khả năng đọc và ghi nhớ khối lượng văn bản khổng lồ.

DeepSeek ra mắt mô hình V4. Ảnh: Nikkei Asia.

DeepSeek ra mắt mô hình V4. Ảnh: Nikkei Asia.

DeepSeek, ngôi sao của ngành trí tuệ nhân tạo Trung Quốc, vừa chính thức trình làng mô hình V4 sau một thời gian dài trì hoãn. Động thái này được xem là lời thách thức trực diện đối với các đối thủ từ Mỹ trong bối cảnh các mô hình nền tảng của Trung Quốc đang tạo ra áp lực ngày càng lớn.

Với phiên bản xem trước mã nguồn mở, V4 gây ấn tượng mạnh mẽ nhờ khả năng đọc và ghi nhớ khối lượng văn bản khổng lồ. Dòng sản phẩm mới này bao gồm hai phiên bản khác nhau là V4-Pro và V4-Flash, phục vụ đa dạng các nhu cầu từ lập trình chuyên sâu đến các dịch vụ yêu cầu tốc độ cao và chi phí thấp.

Theo công bố từ phía công ty, phiên bản V4-Pro đã đạt đến trình độ hàng đầu trong số các mô hình mã nguồn mở ở các bài kiểm tra về năng lực lập trình. Đáng chú ý, phản hồi từ người dùng cho thấy trải nghiệm trên V4-Pro thậm chí còn vượt qua cả Sonnet 4.5 của Anthropic ở một số khía cạnh.

Mặc dù vẫn còn khoảng cách nhất định về khả năng lập luận so với các dòng máy cao cấp nhất như Opus 4.6, nhưng V4-Pro vẫn được đánh giá là một đối thủ đáng gờm nhờ chất lượng đầu ra tiệm cận ở các tác vụ thông thường. Trong khi đó, phiên bản V4-Flash lại tập trung vào việc tối ưu hóa tài nguyên tính toán, cung cấp dịch vụ qua giao diện lập trình ứng dụng với mức giá rẻ hơn đáng kể so với các phương thức truyền thống.

Một chi tiết quan trọng trong lần ra mắt này là sự xác nhận về mối quan hệ hợp tác giữa DeepSeek và Huawei. Ngay sau khi thông báo được đưa ra, Huawei đã công bố các chỉ số kỹ thuật cụ thể cho thấy V4 vận hành mượt mà trên các dòng chip Ascend nội địa. Trước đó, nhiều nguồn tin cho rằng sự chậm trễ của V4 bắt nguồn từ quá trình chuyển đổi tương thích từ hệ sinh thái chip Nvidia sang chip của Huawei do các lệnh kiểm soát xuất khẩu từ Mỹ.

Việc DeepSeek có thể vận hành hiệu quả trên phần cứng trong nước là một tín hiệu cho thấy Trung Quốc đang nỗ lực xây dựng một hệ sinh thái công nghệ độc lập. Điều này đã khiến giới lãnh đạo công nghệ tại Mỹ, bao gồm cả CEO của Nvidia, phải lên tiếng cảnh báo về nguy cơ các tiêu chuẩn kỹ thuật Mỹ bị thay thế trên quy mô toàn cầu.

Không chỉ vượt trội về công nghệ, DeepSeek còn duy trì chiến lược giá cực kỳ cạnh tranh để thu hút thị trường. Mức giá của V4-Pro thấp hơn rất nhiều so với các mô hình hàng đầu của Mỹ như GPT-5.5 hay các sản phẩm từ Anthropic.

Bằng cách áp dụng cơ chế mới giúp nén thông tin hiệu quả, DeepSeek có thể xử lý dữ liệu đầu vào dài hơn mà vẫn tiết kiệm điện năng và bộ nhớ. Hiện tại, công ty đang trong quá trình huy động vốn với định giá lên tới 20 tỷ USD, bất chấp việc vừa mất đi một số nhân sự chủ chốt vào tay các đối thủ nội địa như ByteDance hay Xiaomi.

Sự xuất hiện của V4 chắc chắn sẽ làm gia tăng nhiệt độ cho cuộc đua trí tuệ nhân tạo tại Trung Quốc. Chỉ trong thời gian ngắn, hàng loạt cái tên như Moonshot, Alibaba và Zhipu cũng đã tung ra các bản cập nhật quan trọng cho các mô hình mã nguồn mở của mình.

Tuy nhiên, với khả năng tối ưu hóa chi phí vận hành xuống mức cực thấp cùng sự hậu thuẫn từ hạ tầng phần cứng nội địa, DeepSeek đang chứng minh họ không chỉ là một hiện tượng nhất thời mà là một đối thủ chiến lược có khả năng định hình lại trật tự công nghệ thế giới. Cuộc chiến thuật toán giờ đây không chỉ dừng lại ở sức mạnh xử lý mà còn là cuộc đua về tính hiệu quả và sự tự chủ về mặt công nghệ cốt lõi.

Theo Nikkei Asia

https://asia.nikkei.com/business/technology/artificial-intelligence/china-s-deepseek-unveils-v4-ai-model-in-fresh-challenge-to-us-rivals

Tiến Dũng

Nguồn VietTimes: https://viettimes.vn/deepseek-ra-mat-phien-ban-moi-co-the-ghi-nho-luong-van-ban-khong-lo-post197076.html