Thêm loạt AI mạnh mẽ từ Trung Quốc

5 giờ trước Gốc

Mô hình có thể sánh ngang với các đối thủ mạnh mẽ trên toàn thế giới, báo hiệu tiềm năng công nghệ ngày càng lớn từ đất nước tỷ dân.

Qwen3, công nghệ mới ra mắt từ Alibaba. Ảnh: Reuters.

Ngày 28/4, ông lớn ngành công nghệ Alibaba của Trung Quốc ra mắt một loạt mô hình AI mang tên Qwen3. Công ty tuyên bố chatbot này có thể sánh ngang, thậm chí vượt trội hơn các mô hình tốt nhất hiện nay từ OpenAI hay Google trong một số trường hợp.

Với kích thước lên đến 235 tỷ tham số, Qwen3 có hiệu suất làm việc ngang bằng với DeepSeek-V2 và OpenAI GPT-4, lần lượt sở hữu khoảng 236 tỷ và 175 tỷ tham số. Người dùng sẽ sớm có thể tải xuống bằng giấy phép mở trên nền tảng phát triển AI Hugging Face và Github một khi loạt mô hình này được phát hành.

Công ty cho biết bộ sưu tập Qwen3 bao gồm những mô hình lai, nghĩa là chúng có thể linh hoạt thời gian để suy luận giải quyết vấn đề phức tạp hoặc nhanh chóng phản hồi yêu cầu đơn giản. Trong đó, khả năng suy luận giúp mô hình tự kiểm tra tính chính xác của thông tin, nhưng nhận lại độ trễ cao.

Thiết kế này giúp người dùng dễ dàng phân bố ngân sách phù hợp cho từng tác vụ cụ thể. Ngoài ra, mô hình này cũng học hỏi từ nhiều từ đối thủ trên thế giới.

Sử dụng kiến trúc "mixture of experts" (MoE) giống DeepSeek, Qwen3 có thể tối ưu hiệu suất tính toán nhưng chỉ dùng phần nhỏ chi phí huấn luyện. Đây là phương pháp chia nhỏ tác vụ thành nhiều phần việc riêng biệt và chỉ đề xuất một lượng dữ liệu chuyên sâu vừa đủ để thực hiện.

Theo đội ngũ phát triển, Qwen3 hỗ trợ tới 119 ngôn ngữ và được huấn luyện trên một tập dữ liệu gần 36 nghìn tỷ token, tương đương 27 nghìn tỷ từ. Dữ liệu đào tạo được lấy từ nhiều nguồn như sách giáo khoa, bộ câu hỏi - đáp án, đoạn mã lập trình, hay do AI tự tạo ra,...

Những cải tiến này, cùng nhiều yếu tố khác, đã giúp nâng cao đáng kể năng lực của chatbot so với thế hệ tiền nhiệm Qwen2. Techcrunch nhận xét rằng mặc dù Qwen 3 vẫn chưa vượt trội hoàn toàn so với các mô hình hàng đầu gần đây như o3 hay o4-mini của OpenAI, chúng vẫn thể hiện hiệu suất rất ấn tượng.

So sánh điểm số từ các bài kiểm tra đánh giá. Ảnh: Qwen/X.

Qwen-3-235B-A22B, mô hình lớn nhất trong bộ sưu tập, đã vượt qua o3-mini của OpenAI và Gemini 2.5 Pro của Google trên Codeforces, nền tảng thi lập trình nổi tiếng. Phần mềm này cũng đạt kết quả tốt hơn o3-mini trong bài kiểm tra năng lực giải toán khó AIME và BFCL, đánh giá khả năng suy luận của mô hình.

Hiện Qwen-3-235B-A22B vẫn chưa được ra mắt chính thức với công chúng. Trong khi đó, người dùng có thể tải xuống Qwen3-32B. Mô hình này vượt qua o1 của OpenAI trong một số đánh giá, bao gồm cả bài kiểm tra lập trình LiveCodeBench.

Alibaba cho biết Qwen3 vượt trội trong khả năng gọi công cụ (tool-calling), tuân thủ hướng dẫn và sao chép chính xác các định dạng dữ liệu. Đây là yếu tố mà nhiều công cụ khác còn thiếu. Nghiên cứu của Đại học Carnegie Mellon cho thấy nhiều AI tự chế thêm thông tin, và thay đổi định dạng dù đã được yêu cầu cụ thể.

Ngoài tải về trên các nền tảng trên, người dùng có thể tìm thấy Qwen3 thông qua các nhà cung cấp dịch vụ đám mây như Fireworks AI và Hyperbolic. Điều này cho phép doanh nghiệp lớn, nhỏ, lẫn lập trình viên cá nhân có thể truy cập, thử nghiệm vượt qua rào cản.

Sự ra đời của một số AI Trung Quốc như Qwen đã gia tăng áp lực lên các phòng nghiên cứu của Mỹ, thúc đẩy họ phát triển công nghệ mạnh mẽ hơn. Vì thế, các nhà hoạch định chính sách của nước này đã ban hành biện pháp hạn chế nhằm giới hạn khả năng tiếp cận chip của Trung Quốc.

Tuhin Srivastava, CEO của công ty lưu trữ AI đám mây Baseten, nhận định rằng Qwen3 là một ví dụ nữa cho xu hướng mô hình mã nguồn mở đang bắt kịp hệ thống mã nguồn đóng như của OpenAI.

Qwen3 chắc chắn vẫn sẽ được sử dụng rộng rãi trong nước mặc cho hạn chế từ Chính phủ Mỹ. “Điều này cho thấy rằng giới công nghệ Trung Quốc ngoài phụ thuộc vào những mô hình sẵn có như Anthropic và OpenAI, họ vẫn có thể tự phát triển phần mềm riêng cho mình”, ông cho biết.

Nhật Tường

Nguồn Znews: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html