Bí mật để chiến thắng của các mô hình AI Trung Quốc: Nhanh, nhiều, tốt, rẻ?

Các mô hình AI của Trung Quốc do các nhóm như DeepSeek và MiniMax phát triển đã vượt qua các đối thủ của Mỹ về mức tiêu thụ token.

 Cần khoảng 1.300 token để tạo ra 1.000 từ văn bản

Cần khoảng 1.300 token để tạo ra 1.000 từ văn bản

Ngành công nghiệp AI của Trung Quốc đang cho thấy sức mạnh đáng sợ khi liên tục cho ra những cái tên đình đám. Từ DeepSeek đến MiniMax và gần nhất là OpenClaw, các AI của người Trung Quốc dần chiếm lĩnh thị trường mặt hàng "nóng" nhất của ngành công nghiệp trí tuệ nhân tạo toàn cầu: Token.

Theo dữ liệu của OpenRouter, công ty theo dõi các đơn vị văn bản, mã hoặc dữ liệu được xử lý bởi các mô hình ngôn ngữ lớn, kể từ tháng 2, các mô hình AI của Trung Quốc do các nhóm như DeepSeek và MiniMax tạo ra đã vượt qua các đối thủ Mỹ về mức tiêu thụ token.

Sự thay đổi này cho thấy một bước ngoặt sâu sắc hơn trong cuộc đua AI, khi Jensen Huang của Nvidia cho biết trong tháng này rằng việc sản xuất và sử dụng các đơn vị kỹ thuật số sẽ thúc đẩy nền kinh tế AI. Vì các nhà phát triển phải trả phí theo từng token, nên nó vừa là thước đo cho việc áp dụng các mô hình, vừa là chiến trường định giá giữa các công ty AI.

Khi các tác nhân AI, chẳng hạn như những tác nhân được xây dựng trên nền tảng mã nguồn mở OpenClaw, tiêu thụ lượng token nhiều hơn đáng kể so với các chatbot trước đây, khả năng sản xuất token giá rẻ đang định hình lại cạnh tranh toàn cầu - và mang lại cho Trung Quốc một lợi thế mới.

Nếu tác nhân của bạn tiêu thụ hàng triệu token mỗi ngày, ngay cả một sự chênh lệch nhỏ về giá mỗi token cũng trở thành một khoản mục đáng kể,” Will Liang, giám đốc điều hành của Amplify AI Group, một công ty tư vấn công nghệ có trụ sở tại Sydney, cho biết.

“Đó là một động lực thúc đẩy mang tính cấu trúc cho các phòng thí nghiệm của Trung Quốc, và nó sẽ chỉ tăng lên khi việc áp dụng tác nhân AI được mở rộng.” Lợi thế về chi phí của các nhóm AI Trung Quốc bắt nguồn từ năng lượng rẻ hơn và các mô hình hiệu quả hơn, cho phép các công ty như MiniMax và Moonshot tính phí từ 2 đến 3 USD cho mỗi triệu token đầu ra, so với khoảng 15 USD cho Claude Sonnet 4.5 của Anthropic - một khoảng cách gần gấp sáu lần.

Sự khác biệt trở nên rõ rệt hơn với các tác nhân AI, chúng tiêu thụ nhiều token hơn hẳn so với chatbot. Tóm tắt vở kịch Hamlet của Shakespeare có thể tốn khoảng 30.000 token đối với một chatbot, nhưng một tác nhân AI có thể cần tới 20 triệu token cho một tác vụ lập trình nhỏ. Điều này đang thay đổi cách các nhà phát triển AI lựa chọn chi tiêu tiền của họ. Terry Zhang, một nhà phát triển ở Hồng Kông, cho biết hiện ông chi khoảng 50 USD mỗi ngày để sử dụng mô hình Kimi của Moonshot cho khoảng 80% công việc của mình, và dành mô hình Claude của Anthropic cho các tác vụ phức tạp hơn.

“Trước đây tôi chỉ gọi cho Claude, nhưng giờ khối lượng công việc ngày càng tăng, chỉ dùng Claude thôi thì tốn khoảng 900 USD một ngày,” anh ấy nói. “Quá nhiều! Và việc sử dụng kết hợp cả Kimi và Claude rất phù hợp với tôi.”

Xu hướng này đang tác động tích cực đến doanh thu. MiniMax, với mẫu M2.5 hiện đang nằm trong số những thiết bị được sử dụng nhiều nhất trên toàn cầu về mức tiêu thụ token, đã chứng kiến mức sử dụng token tăng 476% so với tháng trước tính đến ngày 20/3, theo OpenRouter.

Mặc dù OpenRouter chỉ chiếm một phần nhỏ trong tổng số lượng mô hình được sử dụng trên toàn cầu, nhưng nó được sử dụng rộng rãi như một chỉ số của ngành, vì dữ liệu như vậy rất khan hiếm ở những nơi khác.

Các tập đoàn của Mỹ vẫn đang phát triển nhanh chóng khi thị trường tổng thể mở rộng, với OpenAI, Anthropic và Google đều báo cáo tăng trưởng doanh thu và mức độ sử dụng mạnh mẽ. Tuy nhiên, các mô hình chi phí thấp hơn của Trung Quốc đã có cơ hội chiếm lĩnh thị phần người dùng trên toàn thế giới.

Lợi thế về giá token của Trung Quốc một phần đến từ khoản đầu tư khổng lồ của nước này vào năng lượng tái tạo. Tháng này, chính phủ Trung Quốc đã chỉ định “sự phối hợp giữa điện toán và điện năng” là ưu tiên quốc gia trong báo cáo công tác năm 2026, liên kết rõ ràng chính sách năng lượng với khả năng cạnh tranh về trí tuệ nhân tạo.

Về mảng phần mềm, các tập đoàn Trung Quốc đã áp dụng các kiến trúc AI hiệu quả, chẳng hạn như thiết kế "kết hợp nhiều chuyên gia" giúp giảm nhu cầu tính toán, đôi khi phải đánh đổi bằng độ chính xác. Việc thúc đẩy hiệu quả tính toán này xuất phát từ sự thiếu hụt các chip tiên tiến tại Trung Quốc do các biện pháp kiểm soát xuất khẩu của Mỹ.

Có những hạn chế về mặt kỹ thuật. Mô hình GLM-5 của Zhipu AI đã từng đứng đầu bảng xếp hạng OpenRouter trong thời gian ngắn vào tháng Hai trước khi lượng sử dụng tăng đột biến vượt quá khả năng tính toán của nó, gây ra hiện tượng chậm trễ và suy giảm chất lượng dịch vụ.

Công ty này, sau khi phải xin lỗi và tăng giá, đã chứng kiến giá cổ phiếu giảm 22% trong ngày, xóa sổ hơn 10 tỷ đô la giá trị vốn hóa thị trường.

“Khả năng của mô hình rất quan trọng, nhưng tính toán ổn định và dịch vụ hỗ trợ cũng thiết yếu không kém,” một nhà phát triển kỳ cựu tại Google cho biết. Google Gemini 3 Flash đứng thứ hai trong số năm mô hình được sử dụng nhiều nhất tháng này, chỉ sau Minimax.

Các ông lớn công nghệ Trung Quốc đã nhanh chóng tận dụng lợi thế của mình. Đầu tháng này, Alibaba đã thông báo thành lập Alibaba Token Hub, một nhóm kinh doanh mới do giám đốc điều hành Eddie Wu lãnh đạo. Đơn vị này cho thấy quan điểm của Alibaba rằng kinh tế token sẽ định hình giai đoạn tiếp theo của cuộc cạnh tranh trí tuệ nhân tạo.

“Chúng ta đang đứng trước ngưỡng cửa của một bước ngoặt về Trí tuệ Nhân tạo Tổng quát (AGI)”, Wu viết trong một bản ghi nhớ nội bộ tuần trước. “Hàng tỷ tác nhân AI đang sẵn sàng đảm nhận một phần công việc kỹ thuật số ngày càng lớn, mỗi tác nhân được vận hành bởi các mã thông báo do mô hình tạo ra, và những tác nhân này sẽ ngày càng trở thành giao diện chính giữa con người và thế giới kỹ thuật số.”

Liệu lợi thế tượng trưng của Trung Quốc có thể duy trì được hay không vẫn chưa rõ ràng, đặc biệt khi một số công ty vẫn thận trọng khi dựa vào các mô hình được vận hành trên các trung tâm dữ liệu của Trung Quốc.“Những trở ngại về địa chính trị là rất đáng kể, đặc biệt đối với các chính phủ và các ngành công nghiệp được quản lý chặt chẽ,” Liang của Amplify cho biết. “Các cơ quan quản lý đang đặt ra những câu hỏi khó hơn về việc dữ liệu được xử lý ở đâu và thuộc thẩm quyền của ai.”

Theo FT

Thái Duy

Nguồn Thương Gia: https://thuonggiaonline.vn/bi-mat-de-chien-thang-cua-cac-mo-hinh-ai-trung-quoc-nhanh-nhieu-tot-re-post569022.html