MiniMax ra mắt mô hình AI M3 với khả năng xử lý ngữ cảnh siêu dài

Vào ngày 1/6, công ty công nghệ MiniMax chính thức giới thiệu mô hình AI đa dụng mới mang tên MiniMax M3, có khả năng xử lý ngữ cảnh siêu dài.

MiniMax ra mắt mô hình AI M3

MiniMax ra mắt mô hình AI M3

Bằng việc ứng dụng một kiến trúc mạng nơ-ron hoàn toàn mới, do chính hãng tự nghiên cứu và phát triển, mô hình M3 đã đạt được những bước tiến vượt bậc trong việc nâng cao khả năng lập trình, khả năng xử lý đa phương thức tích hợp sẵn và duy trì dung lượng cửa sổ ngữ cảnh cực lớn.

Sức mạnh công nghệ từ kiến trúc MiniMax Sparse Attention

Mấu chốt tạo nên sức mạnh của mô hình M3 nằm ở kiến trúc xử lý chọn lọc mang tên MiniMax Sparse Attention, hay gọi tắt là MSA. Đây là một cơ chế được tinh chỉnh nhằm giải quyết bài toán nút thắt cổ chai về mặt hiệu suất mà các mô hình ngôn ngữ lớn thường xuyên gặp phải khi xử lý khối lượng dữ liệu khổng lồ.

Các thông tin công khai cho thấy M3 hiện là mô hình ngôn ngữ lớn đầu tiên tại Trung Quốc sở hữu đồng thời ba năng lực cốt lõi. Ba năng lực này bao gồm khả năng viết mã lập trình ở mức độ tiên tiến, xử lý ngữ cảnh siêu dài lên đến 1 triệu token và khả năng xử lý đa phương thức tích hợp sẵn. Trên quy mô toàn cầu, M3 cũng đang là tùy chọn nguồn mở duy nhất quy tụ trọn vẹn sự kết hợp của toàn bộ các khả năng mạnh mẽ này trong cùng một nền tảng.

Cột sống hỗ trợ cho sự tích hợp của ba khả năng lớn này chính là kiến trúc MSA do công ty tự phát triển. So với các cơ chế chú ý toàn phần truyền thống, cấu trúc thưa thớt của MSA có thể làm giảm đáng kể chi phí xử lý thuật toán dưới các điều kiện đọc hiểu dữ liệu dài. Hệ thống cho phép mở rộng cửa sổ ngữ cảnh lên mức tối đa là 1 triệu token, tương đương với hàng nghìn trang tài liệu văn bản.

Điều này có nghĩa là khi đối mặt với các tình huống thực tế phức tạp như đọc một báo cáo tài chính rất dài, phân tích một kho lưu trữ mã nguồn phần mềm đồ sộ hay thực hiện cộng tác tác vụ qua nhiều vòng hội thoại, mô hình vẫn có thể duy trì được một chuỗi thông tin hoàn chỉnh trong một lần suy luận duy nhất. Việc nạp toàn bộ một cuốn sách dày cộp hay hàng chục nghìn dòng mã vào bộ nhớ máy tính để phân tích giờ đây trở nên liền mạch và chính xác hơn bao giờ hết.

Khả năng lưu trữ khối lượng lớn dữ liệu đầu vào giúp loại bỏ tình trạng quên kiến thức hoặc bỏ sót các chi tiết quan trọng thường thấy ở các thế hệ trí tuệ nhân tạo trước đây. Mức độ tối ưu hóa sâu rộng của kiến trúc mới còn mang lại lợi thế khổng lồ về mặt chi phí vận hành.

Theo công bố chi tiết từ phía MiniMax, với quy mô cửa sổ ngữ cảnh đạt mức 1 triệu token, chi phí tính toán cho từng token của mô hình AI M3 chỉ bằng khoảng 1/20 so với mô hình thế hệ trước đó. Việc giảm mạnh mức độ tiêu thụ tài nguyên phần cứng này giúp cải thiện hiệu suất suy luận một cách rõ rệt, tạo điều kiện thuận lợi để các nhà phát triển và doanh nghiệp đưa công nghệ này vào các sản phẩm thương mại một cách dễ dàng và đạt hiệu quả kinh tế cao hơn.

Hiệu năng vượt trội của mô hình AI M3 và chiến lược thương mại hóa rộng rãi

Sự xuất hiện của MiniMax M3 thực sự đã thiết lập một tiêu chuẩn mới cho các mô hình nguồn mở thông qua hàng loạt các bài kiểm tra đánh giá nghiêm ngặt. Các dữ liệu đo lường độc lập cho thấy M3 thể hiện sự cải thiện rất lớn về cả khả năng lập trình và năng lực của các tác tử AI. Cụ thể, trên bài kiểm tra SWE-Bench Pro vốn được thiết kế chuyên biệt để đo lường hiệu suất viết, hiểu và sửa lỗi mã nguồn phần mềm, mô hình MiniMax M3 đã xuất sắc vượt qua các đối thủ nặng ký toàn cầu như GPT-5.5 và Gemini 3.1 Pro.

Điểm số của M3 bám rất sát mô hình Opus 4.7, khẳng định vị thế vững chắc của nó trong nhóm những trí tuệ nhân tạo hỗ trợ lập trình thông minh nhất thế giới ở thời điểm hiện tại. Tương tự, trong bài kiểm tra đánh giá toàn diện SVG-Bench chuyên về hiệu suất tạo hình ảnh vector, MiniMax M3 thậm chí còn vượt qua cả Opus 4.7.

Về mặt thương mại hóa và tiếp cận người dùng cuối, MiniMax đã đồng thời ra mắt chương trình đăng ký dịch vụ theo mô hình gói cước có tên gọi là Token Plan. Chương trình này được phân chia thành ba mức độ khác nhau nhằm đáp ứng đa dạng nhu cầu của thị trường. Gói dịch vụ Plus có mức phí là 49 nhân dân tệ mỗi tháng, cung cấp cho người dùng dung lượng 600 triệu token để sử dụng cho các tác vụ hỏi đáp và sáng tạo nội dung cơ bản. Đối với những nhà phát triển có tần suất làm việc cao hơn, gói dịch vụ Max với mức phí 119 nhân dân tệ mỗi tháng sẽ là lựa chọn phù hợp, đi kèm với 1,8 tỉ token.

Ở cấp độ cao cấp nhất, hướng tới các tổ chức và doanh nghiệp ứng dụng trí tuệ nhân tạo ở quy mô công nghiệp để xử lý dữ liệu lớn, MiniMax cung cấp gói dịch vụ Ultra. Gói đăng ký chuyên nghiệp này yêu cầu mức phí 469 nhân dân tệ mỗi tháng, mang lại nguồn tài nguyên tính toán khổng lồ lên tới 5,5 tỉ token.

Hệ thống phân chia linh hoạt này cho thấy chiến lược kinh doanh nhạy bén của công ty trong việc phổ cập công nghệ hiệu suất cao đến với mọi đối tượng khách hàng. Việc tung ra mô hình M3 kết hợp với mức giá tiếp cận hợp lý được kỳ vọng sẽ thúc đẩy một hệ sinh thái ứng dụng mạnh mẽ, đưa sức mạnh của trí tuệ nhân tạo vào sâu trong các hoạt động sản xuất và đời sống xã hội.

Bùi Tú

Nguồn Một Thế Giới: https://1thegioi.vn/minimax-ra-mat-mo-hinh-ai-m3-voi-kha-nang-xu-ly-ngu-canh-sieu-dai-252533.html