DeepSeek bị soán ngôi

Mô hình AI mang tên Qwen3 của Alibaba đã vượt qua R1 trong các bài kiểm tra LiveBench đánh giá khả năng mô hình mã nguồn mở bao gồm lập trình, toán học và phân tích dữ liệu.

Qwen3, công nghệ mới ra mắt từ Alibaba. Ảnh: SCMP.

Theo các bài kiểm tra tiêu chuẩn mới nhất của giới AI, mô hình trí tuệ nhân tạo Qwen3 mới được phát hành của Alibaba đã vượt qua R1 của DeepSeek để trở thành mô hình nguồn mở được xếp hạng cao nhất thế giới.

Cụ thể, dữ liệu từ LiveBench, một nền tảng độc lập chấm điểm các mô hình ngôn ngữ lớn (LLM), công nghệ nền tảng cho các dịch vụ AI tạo sinh như ChatGPT, cho thấy Qwen3 đã vượt qua R1 trong các bài kiểm tra.

Bài đánh giá khả năng của các mô hình AI mã nguồn mở bao gồm lập trình, toán học, phân tích dữ liệu và hướng dẫn ngôn ngữ.

Loạt mô hình AI mang tên Qwen3 được Alibaba phát hành vào ngày 28/4 vừa qua. Công ty tuyên bố chatbot này có thể sánh ngang, thậm chí vượt trội các mô hình tốt nhất hiện nay từ OpenAI hay Google trong một số trường hợp.

Với kích thước lên đến 235 tỷ tham số, Qwen3 có hiệu suất làm việc ngang bằng với DeepSeek-V2 và OpenAI GPT-4, lần lượt sở hữu khoảng 236 tỷ và 175 tỷ tham số. Người dùng sẽ sớm có thể tải xuống bằng giấy phép mở trên nền tảng phát triển AI Hugging Face và Github một khi loạt mô hình này được phát hành.

Công ty cho biết bộ sưu tập Qwen3 bao gồm những mô hình lai, nghĩa là chúng có thể linh hoạt thời gian để suy luận giải quyết vấn đề phức tạp hoặc nhanh chóng phản hồi yêu cầu đơn giản. Trong đó, khả năng suy luận giúp mô hình tự kiểm tra tính chính xác của thông tin, nhưng nhận lại độ trễ cao.

Thiết kế này giúp người dùng dễ dàng phân bố ngân sách phù hợp cho từng tác vụ cụ thể. Ngoài ra, mô hình này cũng học hỏi từ nhiều từ đối thủ trên thế giới.

Sử dụng kiến trúc "mixture of experts" (MoE) giống DeepSeek, Qwen3 có thể tối ưu hiệu suất tính toán nhưng chỉ dùng phần nhỏ chi phí huấn luyện. Đây là phương pháp chia nhỏ tác vụ thành nhiều phần việc riêng biệt và chỉ đề xuất một lượng dữ liệu chuyên sâu vừa đủ để thực hiện.

Theo đội ngũ phát triển, Qwen3 hỗ trợ tới 119 ngôn ngữ và được huấn luyện trên một tập dữ liệu gần 36.000 tỷ token, tương đương 27.000 tỷ từ. Dữ liệu đào tạo được lấy từ nhiều nguồn như sách giáo khoa, bộ câu hỏi - đáp án, đoạn mã lập trình, hay do AI tự tạo ra,...

Dù đứng đầu bảng xếp hạng mã nguồn mở, bài kiểm tra mở rộng của LiveBench cho thấy Qwen3 vẫn xếp sau các mô hình AI nguồn đóng hàng đầu thế giới. Nổi bật nhất trong số này lần lượt là o3 của OpenAI, Gemini Pro 2.5 của Google và Claude 3.7 của Anthropic.

Hiện tại, mô hình cao cấp nhất của OpenAI do Microsoft hỗ trợ, o3-mini high là cái tên đứng đầu bảng xếp hạng tổng thể các mô hình AI trên thế giới.

Anh Tuấn