DeepSeek ra mắt phiên bản mới có thể ghi nhớ lượng văn bản khổng lồ

Với phiên bản xem trước mã nguồn mở, DeepSeek V4 gây ấn tượng mạnh mẽ nhờ khả năng đọc và ghi nhớ khối lượng văn bản khổng lồ.

2 giờ trước Gốc

DeepSeek ra mắt mô hình V4. Ảnh: Nikkei Asia.

DeepSeek, ngôi sao của ngành trí tuệ nhân tạo Trung Quốc, vừa chính thức trình làng mô hình V4 sau một thời gian dài trì hoãn. Động thái này được xem là lời thách thức trực diện đối với các đối thủ từ Mỹ trong bối cảnh các mô hình nền tảng của Trung Quốc đang tạo ra áp lực ngày càng lớn.

Với phiên bản xem trước mã nguồn mở, V4 gây ấn tượng mạnh mẽ nhờ khả năng đọc và ghi nhớ khối lượng văn bản khổng lồ. Dòng sản phẩm mới này bao gồm hai phiên bản khác nhau là V4-Pro và V4-Flash, phục vụ đa dạng các nhu cầu từ lập trình chuyên sâu đến các dịch vụ yêu cầu tốc độ cao và chi phí thấp.

Theo công bố từ phía công ty, phiên bản V4-Pro đã đạt đến trình độ hàng đầu trong số các mô hình mã nguồn mở ở các bài kiểm tra về năng lực lập trình. Đáng chú ý, phản hồi từ người dùng cho thấy trải nghiệm trên V4-Pro thậm chí còn vượt qua cả Sonnet 4.5 của Anthropic ở một số khía cạnh.

Mặc dù vẫn còn khoảng cách nhất định về khả năng lập luận so với các dòng máy cao cấp nhất như Opus 4.6, nhưng V4-Pro vẫn được đánh giá là một đối thủ đáng gờm nhờ chất lượng đầu ra tiệm cận ở các tác vụ thông thường. Trong khi đó, phiên bản V4-Flash lại tập trung vào việc tối ưu hóa tài nguyên tính toán, cung cấp dịch vụ qua giao diện lập trình ứng dụng với mức giá rẻ hơn đáng kể so với các phương thức truyền thống.

Một chi tiết quan trọng trong lần ra mắt này là sự xác nhận về mối quan hệ hợp tác giữa DeepSeek và Huawei. Ngay sau khi thông báo được đưa ra, Huawei đã công bố các chỉ số kỹ thuật cụ thể cho thấy V4 vận hành mượt mà trên các dòng chip Ascend nội địa. Trước đó, nhiều nguồn tin cho rằng sự chậm trễ của V4 bắt nguồn từ quá trình chuyển đổi tương thích từ hệ sinh thái chip Nvidia sang chip của Huawei do các lệnh kiểm soát xuất khẩu từ Mỹ.

Việc DeepSeek có thể vận hành hiệu quả trên phần cứng trong nước là một tín hiệu cho thấy Trung Quốc đang nỗ lực xây dựng một hệ sinh thái công nghệ độc lập. Điều này đã khiến giới lãnh đạo công nghệ tại Mỹ, bao gồm cả CEO của Nvidia, phải lên tiếng cảnh báo về nguy cơ các tiêu chuẩn kỹ thuật Mỹ bị thay thế trên quy mô toàn cầu.

Không chỉ vượt trội về công nghệ, DeepSeek còn duy trì chiến lược giá cực kỳ cạnh tranh để thu hút thị trường. Mức giá của V4-Pro thấp hơn rất nhiều so với các mô hình hàng đầu của Mỹ như GPT-5.5 hay các sản phẩm từ Anthropic.

Bằng cách áp dụng cơ chế mới giúp nén thông tin hiệu quả, DeepSeek có thể xử lý dữ liệu đầu vào dài hơn mà vẫn tiết kiệm điện năng và bộ nhớ. Hiện tại, công ty đang trong quá trình huy động vốn với định giá lên tới 20 tỷ USD, bất chấp việc vừa mất đi một số nhân sự chủ chốt vào tay các đối thủ nội địa như ByteDance hay Xiaomi.

Sự xuất hiện của V4 chắc chắn sẽ làm gia tăng nhiệt độ cho cuộc đua trí tuệ nhân tạo tại Trung Quốc. Chỉ trong thời gian ngắn, hàng loạt cái tên như Moonshot, Alibaba và Zhipu cũng đã tung ra các bản cập nhật quan trọng cho các mô hình mã nguồn mở của mình.

Tuy nhiên, với khả năng tối ưu hóa chi phí vận hành xuống mức cực thấp cùng sự hậu thuẫn từ hạ tầng phần cứng nội địa, DeepSeek đang chứng minh họ không chỉ là một hiện tượng nhất thời mà là một đối thủ chiến lược có khả năng định hình lại trật tự công nghệ thế giới. Cuộc chiến thuật toán giờ đây không chỉ dừng lại ở sức mạnh xử lý mà còn là cuộc đua về tính hiệu quả và sự tự chủ về mặt công nghệ cốt lõi.

Theo Nikkei Asia

https://asia.nikkei.com/business/technology/artificial-intelligence/china-s-deepseek-unveils-v4-ai-model-in-fresh-challenge-to-us-rivals

Tiến Dũng

Nguồn VietTimes: https://viettimes.vn/deepseek-ra-mat-phien-ban-moi-co-the-ghi-nho-luong-van-ban-khong-lo-post197076.html

Mỹ phát cảnh báo Trung Quốc 'đánh cắp' công nghệ AI ở quy mô công nghiệp, Bắc Kinh bác bỏ

1 giờ

Vì sao Nvidia lấn sân sang phát triển mô hình trí tuệ nhân tạo?

2 giờ

Vốn hóa thị trường của Nvidia lại vượt mốc 5.000 tỷ USD

1 giờ

Tin nóng

Xăng E10: 'Cú hích' nâng giá trị cây mía, 'mở đường' kinh tế tuần hoàn

6 giờ

Xăng E10 mở ra cơ hội nâng giá trị cây mía, thúc đẩy kinh tế tuần hoàn. Tuy nhiên, ngành mía đường vẫn cần tháo gỡ 'nút thắt' về liên kết, công nghệ và chính sách.

Âm thanh TV tệ đến mức dùng loa Bluetooth rẻ tiền còn hay hơn

6 giờ

TV hiện đại là một kỳ tích công nghệ với hình ảnh sắc nét, nhưng âm thanh của chúng lại thường không đạt yêu cầu.

TP.HCM trao chứng nhận đầu tư cho 4 dự án công nghệ cao 1,23 tỷ USD

3 giờ

Các dự án với tổng vốn hơn 1,23 tỷ USD được trao chứng nhận đầu tư dịp này tập trung vào trung tâm dữ liệu, y sinh và sản xuất điện tử, hạ tầng công nghệ lõi...

Vé chung kết World Cup 2026 được rao bán lại với mức giá 'gây choáng váng'

5 giờ

Những tấm vé xem trực tiếp trận chung kết FIFA World Cup 2026 đang được rao bán lại với mức giá 'gây choáng váng', thậm chí có vé vượt quá 2 triệu USD.

Nền kinh tế 'token' - Mô hình mới đang ngày càng được quan tâm

4 giờ

Trong bài viết đăng trên tờ SCMP, tác giả Lizzi C. Lee nhận định việc xuất khẩu token không chỉ giúp Trung Quốc hội nhập lợi thế năng lượng vào các hệ thống trí tuệ nhân tạo toàn cầu, mà còn kéo chuỗi giá trị sâu hơn vào nội địa nước này.

Agentic AI: Từ 'trợ lý' thành 'người thực thi' trong doanh nghiệp

3 giờ

Trong vài năm trở lại đây, trí tuệ nhân tạo (AI) đã đi từ vai trò hỗ trợ sang tham gia trực tiếp vào quá trình vận hành của doanh nghiệp.

Tin mới

Apple sẽ ra mắt MacBook Ultra với nhiều nâng cấp mới

22 phút

MacBook Ultra được đồn đoán nâng cấp mạnh về OLED, cảm ứng và thiết kế mới.

Merkava Mark IV - xe tăng chủ lực đặt sinh mạng kíp lái lên hàng đầu của Israel

Chuyên trang An Ninh Thủ Đô - Báo Công an nhân dân

36 phút

Được phát triển để đối phó môi trường chiến tranh đặc thù tại Trung Đông, xe tăng chiến đấu chủ lực Merkava Mark IV thể hiện rõ triết lý thiết kế ưu tiên bảo vệ con người, đồng thời duy trì hỏa lực mạnh và khả năng tác chiến linh hoạt.

Mỹ lần đầu gắn đạn xuyên hầm lên UAV cảm tử

44 phút

Mỹ đã lần đầu tiên kết hợp UAV cỡ nhỏ với đầu đạn xuyên hầm, mở ra khả năng tấn công các mục tiêu kiên cố bằng những phương tiện rẻ và linh hoạt hơn nhiều so với trước đây.

XPeng phô diễn hệ sinh thái 'AI vật lý' tại Triển lãm ô tô Bắc Kinh

1 giờ

XPeng giới thiệu hệ sinh thái Trí tuệ nhân tạo (AI) vật lý thế hệ mới, đánh dấu bước chuyển mình mạnh mẽ tại Triển lãm ô tô Bắc Kinh 2026.

Hướng tới Diễn đàn Công nghệ Logistics 2026: J&T Express và câu chuyện AI thực chiến

1 giờ

Trong bối cảnh ngành logistics Việt Nam đang bước qua giai đoạn tăng trưởng nóng để bước vào chu kỳ cạnh tranh khắt khe hơn, câu chuyện không còn chỉ là mở rộng quy mô mà là làm sao vận hành hiệu quả hơn, chính xác hơn và bền vững hơn.

Việt Nam hoàn thiện xe tăng hạng nhẹ T-1 với hỏa lực và cơ động vượt trội

1 giờ

Xe tăng hạng nhẹ T-1 do Nhà máy Z125 chế tạo chuẩn bị bước vào giai đoạn thử nghiệm đánh giá trong năm 2026, khẳng định năng lực tự chủ công nghệ quốc phòng của Việt Nam.

Sẵn sàng cho màn pháo hoa tầm cao phục vụ Giỗ Tổ Hùng Vương

1 giờ

21h30 tối 25/4 (tức ngày 9/3 Âm lịch), tại khu vực cầu đi bộ hồ Công viên Văn Lang (TP Việt Trì, tỉnh Phú Thọ) sẽ diễn ra chương trình bắn pháo hoa tầm cao đặc sắc, phục vụ nhân dân, du khách thập phương về dự Lễ hội Đền Hùng - Giỗ Tổ Hùng Vương và Tuần Văn hóa - Du lịch Đất Tổ năm 2026.

Sẵn sàng cho màn pháo hoa rực sáng Đất Tổ

1 giờ

Chiều 25/4, tại khu vực cầu đi bộ Công viên Văn Lang, phường Việt Trì, tỉnh Phú Thọ, cán bộ, chiến sĩ khẩn trương hoàn tất các khâu lắp đặt, đấu nối và kiểm tra trận địa pháo hoa, chuẩn bị cho màn trình diễn trong đêm 9/3 âm lịch.