ByteDance: Doubao 2.0 dành cho kỷ nguyên tác tử AI, ngang tầm GPT 5.2 và Gemini 3

4 giờ trước Gốc

ByteDance vừa triển khai Doubao 2.0, bản nâng cấp của mô hình làm nền tảng cho ứng dụng AI được sử dụng rộng rãi nhất Trung Quốc.

ByteDance là một trong số nhiều công ty Trung Quốc đang tìm cách tạo tiếng vang trong và ngoài nước cho mô hình AI (trí tuệ nhân tạo) mới của mình trong dịp Tết Nguyên đán, khi hàng trăm triệu người Trung Quốc tham gia các buổi đoàn tụ gia đình tại quê nhà.

Tương tự Alibaba, ByteDance từng bất ngờ trước sự trỗi dậy nhanh chóng của DeepSeek trên toàn cầu trong dịp Tết năm ngoái. Thung lũng Silicon và các nhà đầu tư trên toàn thế giới đã bị sốc trước việc công ty khởi nghiệp Trung Quốc có thể tạo ra mô hình AI ngang tầm sản phẩm tốt nhất của OpenAI, Google và Anthropic nhưng được huấn luyện với chi phí chỉ bằng một phần nhỏ.

Việc ByteDance phát hành Doubao 2.0, trước khi mô hình mới được mong đợi của DeepSeek ra mắt, có khả năng nhằm ngăn chặn kịch bản tương tự lặp lại.

Seedance 2.0, mô hình AI tạo video mà ByteDance phát hành hôm 12.2, đã được so sánh với thành công của DeepSeek năm 2025 sau khi lan truyền mạnh mẽ trên mạng xã hội Trung Quốc và nhận về rất nhiều lời khen từ nước ngoài, gồm cả Elon Musk (chủ sở hữu nền tảng X).

ByteDance nói Doubao 2.0 được định vị cho kỷ nguyên tác tử AI, trong đó các mô hình được kỳ vọng sẽ thực hiện các nhiệm vụ phức tạp trong thế giới thực thay vì chỉ trả lời câu hỏi.

Tác tử AI là loại AI không chỉ phản hồi theo yêu cầu đơn thuần mà có khả năng quan sát, phán đoán và tự hành động để hoàn thành mục tiêu thay mặt người dùng.

Theo ByteDance, phiên bản Doubao 2.0 Pro có khả năng suy luận phức tạp và thực hiện các nhiệm vụ nhiều bước đạt mức tương đương GPT 5.2 của OpenAI và Google Gemini 3 Pro, đồng thời giảm chi phí sử dụng khoảng 10 lần.

ByteDance cho biết: “Lợi thế chi phí này sẽ trở nên quan trọng hơn nữa khi các nhiệm vụ phức tạp trong thế giới thực đòi hỏi suy luận quy mô lớn và tạo nội dung nhiều bước, vốn tiêu tốn lượng token rất lớn”, ám chỉ đơn vị dữ liệu mà mô hình AI xử lý.

Theo dữ liệu từ nhà cung cấp dịch vụ thông tin kinh doanh QuestMobile, công bố cuối tháng 12.2025, Doubao hiện dẫn đầu trong các ứng dụng chatbot AI tại Trung Quốc với 155 triệu người dùng hoạt động hàng tuần, còn DeepSeek đứng thứ hai với 81,6 triệu.

Việc phát hành Doubao 2.0 có thể giúp ByteDance chống lại áp lực ngày càng tăng gần đây từ các đối thủ trong nước.

Theo ByteDance, Doubao 2.0 Pro có khả năng suy luận phức tạp và thực hiện các nhiệm vụ nhiều bước đạt mức tương đương GPT 5.2 và Gemini 3 Pro, đồng thời giảm chi phí sử dụng khoảng 10 lần - Ảnh: MTG

Hôm 2.2, Qwen của Alibaba bắt đầu chiến dịch trị giá 3 tỉ nhân dân tệ (434 triệu USD), cung cấp cho người dùng các bữa ăn và hoạt động miễn phí khi đặt dịch vụ trên sàn thương mại điện tử Taobao, sàn thương mại tức thời Shangou, nền tảng du lịch trực tuyến Fliggy và các sản phẩm khác do tập đoàn có trụ sở tại thành phố Hàng Châu (Trung Quốc) vận hành.

Qwen bắt đầu cung cấp mã giảm giá cho người dùng từ ngày 6.2, cho phép mua hàng trực tiếp trong ứng dụng từ các nền tảng bán lẻ thuộc Alibaba chỉ bằng cách sử dụng câu lệnh qua chatbot AI này.

Theo QuestMobile, động thái đó giúp số người dùng hoạt động hằng ngày của Qwen tăng vọt từ 7 triệu lên 58 triệu, chỉ còn kém 23 triệu so với Doubao trong cùng ngày.

Sáng kiến trên là giai đoạn đầu tiên trong kế hoạch từ Alibaba nhằm thu hút thêm người dùng đến với Qwen trong kỳ nghỉ Tết Nguyên đán của Trung Quốc.

Kể từ tháng trước, Alibaba đã tìm cách biến Qwen thành điểm đến duy nhất, nơi người dùng có thể truy cập trực tiếp các ứng dụng khác của mình trong chatbot và hoàn tất thanh toán, tương tự cách Google tích hợp Gemini vào Maps, Chrome.

Tuy nhiên, quá trình triển khai chiến lược mà Alibaba gọi là agentic AI (AI có tính tự chủ) đã gặp trục trặc kỹ thuật ngay từ khi bắt đầu chương trình tặng mã giảm giá.

Alibaba cho biết đã có 10 triệu đơn đặt hàng được thực hiện trong vòng 9 giờ đầu tiên của chiến dịch. Trước lượng đơn đặt hàng khổng lồ vào cuối tuần, Qwen đã thông báo hôm 8.2 trên kênh Weibo chính thức của mình rằng hệ thống bị quá tải và kêu gọi người dùng hãy cho chatbot một chút thời gian nghỉ ngơi.

Theo hãng tin Reuters, các yêu cầu mua hàng lặp đi lặp lại hôm 9.2 đã tạo ra nhiều thông báo từ chối khác nhau, với lý do số lượng người dùng đăng ký quá nhiều.

"Sự hào hứng của nhiều người với trải nghiệm mua sắm bằng AI quá lớn! Hiện có quá nhiều người tham gia Đặt hàng miễn phí bằng Qwen, chúng tôi đang nỗ lực không ngừng để duy trì trải nghiệm của chiến dịch", Qwen trả lời một trong những yêu cầu mua hàng hôm 9.2.

Qwen cho biết người mua hàng vẫn còn thời gian để sử dụng phiếu giảm giá của họ, có hiệu lực đến ngày 28.2.

Qwen là ứng dụng chatbot và trợ lý AI do Alibaba phát triển, hoạt động dựa trên mô hình ngôn ngữ lớn cùng tên của gã khổng lồ thương mại điện tử Trung Quốc. Đây không chỉ là một chatbot trả lời câu hỏi thông thường, mà còn là trợ lý AI đa năng tích hợp nhiều công cụ lập kế hoạch, sinh nội dung, xử lý tác vụ và tương tác với hệ sinh thái dịch vụ của Alibaba.

Người dùng có thể yêu cầu Qwen nghiên cứu, tạo hình ảnh, viết nội dung, gợi ý mua sắm, đặt đồ ăn, đặt vé du lịch và mua hàng trực tiếp trong ứng dụng bằng lệnh AI… Ngoài ra, Qwen còn tích hợp thanh toán Alipay để hoàn tất giao dịch ngay trong cuộc hội thoại.

Tháng trước, Alibaba thông báo Qwen đã vượt mốc 100 triệu người dùng hoạt động hàng tháng, chỉ trong vòng khoảng 60 ngày kể từ khi chính thức ra mắt bản beta công khai vào giữa tháng 11.2025. Điều này cho thấy tốc độ tăng trưởng cực kỳ nhanh và mức độ ứng dụng rộng rãi của Qwen trong thị trường AI, đặc biệt khi nó được tích hợp sâu vào các dịch vụ hàng ngày.

Các công ty Trung Quốc đua nhau nâng cấp mô hình AI trước Tết

Hôm 11.2, DeepSeek cập nhật mô hình chủ lực của mình trước Tết Nguyên đán, bổ sung khả năng hỗ trợ cửa sổ ngữ cảnh lớn hơn với kiến thức được cập nhật mới hơn, qua đó làm gia tăng kỳ vọng về bản phát hành lớn tiếp theo.

Kể từ ngày 11.2, công ty có trụ sở ở Hàng Châu đã mở rộng cửa sổ ngữ cảnh từ 128.000 token lên hơn 1 triệu token, mức tăng gần gấp 10 lần, được kỳ vọng sẽ cải thiện khả năng xử lý truy vấn của người dùng.

Cửa sổ ngữ cảnh lớn hơn đồng nghĩa với việc mô hình AI có thể ghi nhớ và xử lý nhiều thông tin hơn trong một cuộc trò chuyện hoặc tác vụ duy nhất, cho phép thực hiện suy luận phức tạp hơn hoặc làm việc hiệu quả hơn với dữ liệu và mã nguồn.

Bản cập nhật này cũng đẩy mốc dữ liệu kiến thức của mô hình AI DeepSeek từ tháng 7.2024 lên tháng 5.2025, bổ sung gần 1 năm thông tin mới vào hệ thống và cho phép người dùng tiếp cận dữ liệu cập nhật hơn.

DeepSeek không công bố bản cập nhật này trên các tài khoản mạng xã hội của mình và cũng không phản hồi khi trang SCMP đề nghị bình luận. Vì thế, chưa rõ đây là phiên bản mô hình AI nào.

Việc DeepSeek nâng cấp mô hình AI diễn ra trong bối cảnh xuất hiện nhiều đồn đoán về bản phát hành lớn tiếp theo, được cho là DeepSeek V4.

Các công ty Trung Quốc khác đang chạy đua ra mắt những mô hình AI mới nhất trước Tết Nguyên đán với hy vọng tạo được kỳ tích giống DeepSeek năm ngoái.

Cùng ngày 11.2, Zhipu AI công bố mô hình chủ lực tiếp theo là GLM-5, động thái được dự báo sẽ làm gia tăng cạnh tranh trong cuộc đua AI.

GLM-5 của Zhipu AI được cải thiện về khả năng lập trình và năng lực tự hành động nhờ số lượng tham số tăng gấp đôi và việc áp dụng DeepSeek Sparse Attention. Đây là một kỹ thuật do DeepSeek phát minh nhằm cân bằng giữa hiệu suất mô hình AI và hiệu quả tính toán.

Kỳ vọng về mô hình mới của Zhipu AI cùng sự hào hứng toàn cầu khi Trung Quốc tiến bộ trong lĩnh vực AI giúp giá cổ phiếu công ty tăng vọt.

Trước Zhipu AI, Alibaba và Moonshot AI đã phát hành mô hình AI mới cuối tháng 1 với phiên bản Qwen3-Max-Thinking và Kimi 2.5.

Qwen3-Max-Thinking là phiên bản suy luận nâng cao của dòng Qwen3 với hệ thống suy luận quy mô lớn và hỗ trợ các công cụ gốc như tìm kiếm, ghi nhớ, chạy mã lệnh bên trong mô hình.

Mô hình mới này thay đổi cách suy luận, cho phép kiểm soát chiều sâu tư duy khi tính toán thời gian thực, tận dụng kết quả trung gian để cải thiện hiệu quả và độ chính xác.

Thêm điểm đáng chú ý là Qwen3-Max-Thinking tự quyết định khi nào nên gọi các công cụ như tìm kiếm, ghi nhớ phiên hay thực thi mã, phục vụ tốt hơn các nhiệm vụ tự chủ phức tạp.

Theo gã khổng lồ công nghệ Alibaba, Qwen3-Max-Thinking ghi nhận hiệu suất được cải thiện trong các bài kiểm tra toán học, khoa học, suy luận tổng thể và lập trình.

Một số nguồn tin cho biết Alibaba đang gấp rút hoàn thiện để trình làng phiên bản Qwen 3.5.

Kimi K2.5 của Moonshot AI nhận sự hoan nghênh toàn cầu khi các bài kiểm tra chuẩn cho thấy nó đã đưa khả năng AI mã nguồn mở của Trung Quốc đến gần các hệ thống AI mã nguồn đóng hàng đầu Mỹ hơn bao giờ hết.

Kimi K2.5 là mô hình đa phương thức nguồn mở mạnh mẽ, có khả năng xử lý văn bản, hình ảnh và video trong cùng một kiến trúc mà không cần gắn thêm mô đun riêng biệt.

Hiện tại, Kimi K2.5 được xếp hạng thứ 5 trong chỉ số trí tuệ của Artificial Analysis, chỉ đứng sau 4 mô hình hàng đầu từ các công ty Mỹ.

Ngày 12.2, MiniMax giới thiệu mô hình M2.5 với nhiều cải tiến lớn, đặc biệt tập trung vào khả năng lập trình, suy luận và thực hiện các nhiệm vụ phức tạp trong môi trường thực tế.

Theo MiniMax, M2.5 được thiết kế cho các hệ thống tác tử AI, có khả năng phân tích vấn đề tốt hơn, sử dụng token hiệu quả hơn và xử lý các nhiệm vụ phức tạp như tạo bài thuyết trình, xây dựng mô hình tài chính hoặc phát triển website.

Một trong những điểm nổi bật của M2.5 là hiệu suất lập trình đạt mức hàng đầu ngành. M2.5 đạt kết quả cao trong các bài kiểm tra lập trình đa ngôn ngữ và được đánh giá ngang với những mô hình AI tiên tiến nhất hiện nay.

Theo MiniMax, M2.5 đạt hiệu suất tốt nhất ngành ở Multi-SWE-Bench - thước đo khả năng của mô hình AI về sửa lỗi và phát triển phần mềm trong các dự án thực tế, trên nhiều ngôn ngữ lập trình khác nhau.

Ngoài ra, MiniMax tối ưu hóa tốc độ và độ trễ, giúp M2.5 phù hợp với các môi trường triển khai thực tế cần xử lý lượng lớn yêu cầu với tốc độ cao.

MiniMax cho biết chi phí sử dụng M2.5 chỉ bằng khoảng 1/10 đến 1/20 so với các mô hình AI khác, nhờ tối ưu hóa quá trình suy luận và sử dụng tài nguyên. Điều này giúp doanh nghiệp có thể triển khai AI ở quy mô lớn với chi phí thấp hơn.

Công ty đã mở trọng số M2.5 trên nền tảng như HuggingFace và GitHub, cho phép nhà phát triển tùy chỉnh theo nhu cầu.

Sơn Vân