Một 'tiểu long' AI vừa ra mắt tại Trung Quốc ấn tượng hơn cả DeepSeek R1

Công ty AI có trụ sở tại Thượng Hải, MiniMax vừa ra mắt mô hình ngôn ngữ lớn mới nhất của mình mang tên MiniMax-M1, với độ dài ngữ cảnh (context length) lên tới 1 triệu token. Khả năng này lớn gấp 8 lần so với mô hình DeepSeek R1, cho phép xử lý đồng thời khối lượng thông tin lớn hơn nhiều.

MiniMax được coi là một tiểu long trên thị trường khởi nghiệp AI

MiniMax được coi là một tiểu long trên thị trường khởi nghiệp AI

MiniMax cho biết M1 vượt trội hơn một số đối thủ Trung Quốc sử dụng mã đóng trong các tác vụ về năng suất. Các bài kiểm tra benchmark của công ty cho thấy M1 vượt qua DeepSeek R1-0528. Ngoài ra, công ty còn tuyên bố M1 chỉ sử dụng khoảng 30% tài nguyên so với DeepSeek trong một số điều kiện.

M1 được huấn luyện bằng phương pháp học tăng cường quy mô lớn trên 512 GPU Nvidia H800, với chi phí thuê ước tính 534.700 USD.

MiniMax và cuộc đua "tiểu long" trong hệ sinh thái AI Trung Quốc

MiniMax là một trong những startup AI nổi bật của Trung Quốc, thường được gọi là các “tiểu long”. Đây là thuật ngữ chỉ các startup được hậu thuẫn bởi những tập đoàn lớn như Tencent hay Alibaba. Trong khi nhiều đối thủ đã rút khỏi nghiên cứu nền tảng do áp lực cạnh tranh từ DeepSeek, MiniMax vẫn tiếp tục phát triển các sản phẩm AI mới như công cụ tạo video và ứng dụng bạn đồng hành AI.

Việc MiniMax tuyên bố M1 chỉ dùng 30% tài nguyên so với DeepSeek phản ánh xu hướng phát triển AI tại Trung Quốc tập trung vào tối ưu hóa chi phí tính toán. Trước đó, DeepSeek từng gây chấn động thị trường toàn cầu khi mô hình R1 vượt mặt nhiều đối thủ nhưng có chi phí huấn luyện thấp hơn nhiều, thậm chí khiến cổ phiếu Nvidia sụt giảm.

Việc MiniMax huấn luyện M1 với 512 GPU Nvidia H800 và chi phí dưới 600.000 USD cho thấy chiến lược rõ ràng của các công ty Trung Quốc trong việc kiểm soát chi phí mà vẫn đạt hiệu suất cạnh tranh, trái ngược với mô hình "đốt tiền" của nhiều phòng thí nghiệm AI phương Tây. Cần nhớ, OpenAI hay Anthropic, vốn huy động hàng tỉ USD mà ít chú trọng đến hiệu quả vốn.

Sự bứt phá về hiệu suất tính toán của nhiều công ty Trung Quốc không còn là hiện tượng đơn lẻ, mà là ưu tiên chiến lược của toàn ngành. Chiến lược này thách thức giả định rằng phát triển AI hàng đầu luôn cần nguồn vốn khổng lồ.

Công thức thúc đẩy đổi mới AI tại Trung Quốc

Việc MiniMax được hậu thuẫn bởi các “ông lớn” trong đó có Tencent cho thấy mô hình kết hợp giữa vốn tư nhân và định hướng chiến lược từ nhà nước - một đặc điểm tiêu biểu của hệ sinh thái AI Trung Quốc. Chính phủ Trung Quốc đã tham gia vào hơn 60% các thương vụ đầu tư vào AI sinh, tạo điều kiện thuận lợi cho các công ty như MiniMax và DeepSeek tiếp tục theo đuổi nghiên cứu nền tảng.

Điều này phù hợp với Chiến lược phát triển AI thế hệ mới được ban hành năm 2017, với mục tiêu xây dựng ngành công nghiệp AI trị giá 150 tỉ USD vào năm 2030 thông qua đầu tư công - tư phối hợp.

Tính đến tháng 4.2025, dữ liệu đăng ký cho thấy có 3.739 công cụ AI sinh từ khoảng 2.353 công ty tại Trung Quốc, cho thấy quy mô và chiều sâu của hệ sinh thái AI trong nước.

Dù nhiều “tiểu long” từng phải thu hẹp hoạt động R&D sau sự trỗi dậy của DeepSeek, đột phá của MiniMax cho thấy áp lực cạnh tranh vẫn đang thúc đẩy đổi mới, thay vì dồn vào người thắng duy nhất.

Cuộc đua mở rộng "độ dài ngữ cảnh": Thay đổi cục diện AI

Việc MiniMax nhấn mạnh khả năng xử lý 1 triệu token ngữ cảnh (gấp 8 lần DeepSeek R1) phản ánh cuộc đua mới trong lĩnh vực AI - xử lý thông tin dài hơi và phức tạp hơn. Việc mở rộng "cửa sổ ngữ cảnh" giúp mô hình giải quyết tốt hơn các tác vụ suy luận phức tạp, như phân tích tài liệu dài, xử lý mã nguồn quy mô lớn, hoặc áp dụng trong các hệ thống kiến thức chuyên sâu.

Việc nhảy vọt từ 64.000 token của DeepSeek lên 1 triệu token của MiniMax chỉ trong vài tháng cho thấy tốc độ đổi mới chóng mặt trong ngành AI Trung Quốc. Thậm chí, theo một số đánh giá, năng lực giờ đây của MiniMax tiệm cận các mô hình quốc tế hàng đầu như Gemini 2.5 Pro của Google.

Cuộc cạnh tranh về độ dài ngữ cảnh cho thấy các công ty AI Trung Quốc đang chuyển từ việc tập trung vào ứng dụng sang cạnh tranh trực tiếp về năng lực kỹ thuật nền tảng. Dường như, họ sẵn sàng thu hẹp khoảng cách với phương Tây trong các công nghệ cốt lõi của AI.

Anh Tú

Nguồn Một Thế Giới: https://1thegioi.vn/mot-tieu-long-ai-vua-ra-mat-tai-trung-quoc-an-tuong-hon-ca-deepseek-r1-233895.html