Bí mật để chiến thắng của các mô hình AI Trung Quốc: Nhanh, nhiều, tốt, rẻ?

Các mô hình AI của Trung Quốc do các nhóm như DeepSeek và MiniMax phát triển đã vượt qua các đối thủ của Mỹ về mức tiêu thụ token.

2 giờ trước Gốc

Cần khoảng 1.300 token để tạo ra 1.000 từ văn bản

Ngành công nghiệp AI của Trung Quốc đang cho thấy sức mạnh đáng sợ khi liên tục cho ra những cái tên đình đám. Từ DeepSeek đến MiniMax và gần nhất là OpenClaw, các AI của người Trung Quốc dần chiếm lĩnh thị trường mặt hàng "nóng" nhất của ngành công nghiệp trí tuệ nhân tạo toàn cầu: Token.

Theo dữ liệu của OpenRouter, công ty theo dõi các đơn vị văn bản, mã hoặc dữ liệu được xử lý bởi các mô hình ngôn ngữ lớn, kể từ tháng 2, các mô hình AI của Trung Quốc do các nhóm như DeepSeek và MiniMax tạo ra đã vượt qua các đối thủ Mỹ về mức tiêu thụ token.

Sự thay đổi này cho thấy một bước ngoặt sâu sắc hơn trong cuộc đua AI, khi Jensen Huang của Nvidia cho biết trong tháng này rằng việc sản xuất và sử dụng các đơn vị kỹ thuật số sẽ thúc đẩy nền kinh tế AI. Vì các nhà phát triển phải trả phí theo từng token, nên nó vừa là thước đo cho việc áp dụng các mô hình, vừa là chiến trường định giá giữa các công ty AI.

Khi các tác nhân AI, chẳng hạn như những tác nhân được xây dựng trên nền tảng mã nguồn mở OpenClaw, tiêu thụ lượng token nhiều hơn đáng kể so với các chatbot trước đây, khả năng sản xuất token giá rẻ đang định hình lại cạnh tranh toàn cầu - và mang lại cho Trung Quốc một lợi thế mới.

Nếu tác nhân của bạn tiêu thụ hàng triệu token mỗi ngày, ngay cả một sự chênh lệch nhỏ về giá mỗi token cũng trở thành một khoản mục đáng kể,” Will Liang, giám đốc điều hành của Amplify AI Group, một công ty tư vấn công nghệ có trụ sở tại Sydney, cho biết.

“Đó là một động lực thúc đẩy mang tính cấu trúc cho các phòng thí nghiệm của Trung Quốc, và nó sẽ chỉ tăng lên khi việc áp dụng tác nhân AI được mở rộng.” Lợi thế về chi phí của các nhóm AI Trung Quốc bắt nguồn từ năng lượng rẻ hơn và các mô hình hiệu quả hơn, cho phép các công ty như MiniMax và Moonshot tính phí từ 2 đến 3 USD cho mỗi triệu token đầu ra, so với khoảng 15 USD cho Claude Sonnet 4.5 của Anthropic - một khoảng cách gần gấp sáu lần.

Sự khác biệt trở nên rõ rệt hơn với các tác nhân AI, chúng tiêu thụ nhiều token hơn hẳn so với chatbot. Tóm tắt vở kịch Hamlet của Shakespeare có thể tốn khoảng 30.000 token đối với một chatbot, nhưng một tác nhân AI có thể cần tới 20 triệu token cho một tác vụ lập trình nhỏ. Điều này đang thay đổi cách các nhà phát triển AI lựa chọn chi tiêu tiền của họ. Terry Zhang, một nhà phát triển ở Hồng Kông, cho biết hiện ông chi khoảng 50 USD mỗi ngày để sử dụng mô hình Kimi của Moonshot cho khoảng 80% công việc của mình, và dành mô hình Claude của Anthropic cho các tác vụ phức tạp hơn.

“Trước đây tôi chỉ gọi cho Claude, nhưng giờ khối lượng công việc ngày càng tăng, chỉ dùng Claude thôi thì tốn khoảng 900 USD một ngày,” anh ấy nói. “Quá nhiều! Và việc sử dụng kết hợp cả Kimi và Claude rất phù hợp với tôi.”

Xu hướng này đang tác động tích cực đến doanh thu. MiniMax, với mẫu M2.5 hiện đang nằm trong số những thiết bị được sử dụng nhiều nhất trên toàn cầu về mức tiêu thụ token, đã chứng kiến mức sử dụng token tăng 476% so với tháng trước tính đến ngày 20/3, theo OpenRouter.

Mặc dù OpenRouter chỉ chiếm một phần nhỏ trong tổng số lượng mô hình được sử dụng trên toàn cầu, nhưng nó được sử dụng rộng rãi như một chỉ số của ngành, vì dữ liệu như vậy rất khan hiếm ở những nơi khác.

Các tập đoàn của Mỹ vẫn đang phát triển nhanh chóng khi thị trường tổng thể mở rộng, với OpenAI, Anthropic và Google đều báo cáo tăng trưởng doanh thu và mức độ sử dụng mạnh mẽ. Tuy nhiên, các mô hình chi phí thấp hơn của Trung Quốc đã có cơ hội chiếm lĩnh thị phần người dùng trên toàn thế giới.

Lợi thế về giá token của Trung Quốc một phần đến từ khoản đầu tư khổng lồ của nước này vào năng lượng tái tạo. Tháng này, chính phủ Trung Quốc đã chỉ định “sự phối hợp giữa điện toán và điện năng” là ưu tiên quốc gia trong báo cáo công tác năm 2026, liên kết rõ ràng chính sách năng lượng với khả năng cạnh tranh về trí tuệ nhân tạo.

Về mảng phần mềm, các tập đoàn Trung Quốc đã áp dụng các kiến trúc AI hiệu quả, chẳng hạn như thiết kế "kết hợp nhiều chuyên gia" giúp giảm nhu cầu tính toán, đôi khi phải đánh đổi bằng độ chính xác. Việc thúc đẩy hiệu quả tính toán này xuất phát từ sự thiếu hụt các chip tiên tiến tại Trung Quốc do các biện pháp kiểm soát xuất khẩu của Mỹ.

Có những hạn chế về mặt kỹ thuật. Mô hình GLM-5 của Zhipu AI đã từng đứng đầu bảng xếp hạng OpenRouter trong thời gian ngắn vào tháng Hai trước khi lượng sử dụng tăng đột biến vượt quá khả năng tính toán của nó, gây ra hiện tượng chậm trễ và suy giảm chất lượng dịch vụ.

Công ty này, sau khi phải xin lỗi và tăng giá, đã chứng kiến giá cổ phiếu giảm 22% trong ngày, xóa sổ hơn 10 tỷ đô la giá trị vốn hóa thị trường.

“Khả năng của mô hình rất quan trọng, nhưng tính toán ổn định và dịch vụ hỗ trợ cũng thiết yếu không kém,” một nhà phát triển kỳ cựu tại Google cho biết. Google Gemini 3 Flash đứng thứ hai trong số năm mô hình được sử dụng nhiều nhất tháng này, chỉ sau Minimax.

Các ông lớn công nghệ Trung Quốc đã nhanh chóng tận dụng lợi thế của mình. Đầu tháng này, Alibaba đã thông báo thành lập Alibaba Token Hub, một nhóm kinh doanh mới do giám đốc điều hành Eddie Wu lãnh đạo. Đơn vị này cho thấy quan điểm của Alibaba rằng kinh tế token sẽ định hình giai đoạn tiếp theo của cuộc cạnh tranh trí tuệ nhân tạo.

“Chúng ta đang đứng trước ngưỡng cửa của một bước ngoặt về Trí tuệ Nhân tạo Tổng quát (AGI)”, Wu viết trong một bản ghi nhớ nội bộ tuần trước. “Hàng tỷ tác nhân AI đang sẵn sàng đảm nhận một phần công việc kỹ thuật số ngày càng lớn, mỗi tác nhân được vận hành bởi các mã thông báo do mô hình tạo ra, và những tác nhân này sẽ ngày càng trở thành giao diện chính giữa con người và thế giới kỹ thuật số.”

Liệu lợi thế tượng trưng của Trung Quốc có thể duy trì được hay không vẫn chưa rõ ràng, đặc biệt khi một số công ty vẫn thận trọng khi dựa vào các mô hình được vận hành trên các trung tâm dữ liệu của Trung Quốc.“Những trở ngại về địa chính trị là rất đáng kể, đặc biệt đối với các chính phủ và các ngành công nghiệp được quản lý chặt chẽ,” Liang của Amplify cho biết. “Các cơ quan quản lý đang đặt ra những câu hỏi khó hơn về việc dữ liệu được xử lý ở đâu và thuộc thẩm quyền của ai.”

Theo FT

Thái Duy

Nguồn Thương Gia: https://thuonggiaonline.vn/bi-mat-de-chien-thang-cua-cac-mo-hinh-ai-trung-quoc-nhanh-nhieu-tot-re-post569022.html

Lý do đằng sau sự sụp đổ của AI tạo video Sora đình đám

5 giờ

Nvidia mở 'thế trận' mới sau chip AI

4 phút

Alibaba công bố chip thế hệ mới cho AI tác nhân

Tin nóng

Công an khuyến khích người dân nên làm điều này trên ứng dụng VNeID

4 giờ

Cơ quan Công an kêu gọi người dân chủ động sử dụng ứng dụng VNeID để đánh giá chất lượng giải quyết thủ tục hành chính, đặc biệt trong lĩnh vực xuất nhập cảnh, nhằm nâng cao hiệu quả phục vụ và minh bạch quy trình.

Công cụ làm chậm chatbot AI đến mức 'rùa bò' nhằm bớt phụ thuộc

4 phút

Slow LLM khiến mọi người đặt câu hỏi về sự phụ thuộc vào các công cụ như Claude và ChatGPT bằng cách khiến việc sử dụng các công cụ này trở nên cực kỳ khó chịu.

Sony WF-1000XM6: Chống ồn tốt, nhưng giá có thể khiến nhiều người phải nghĩ

1 giờ

Chiếc tai nghe TWS cao cấp mới Sony WF-1000XM6 tạo ấn tượng với công nghệ chống ồn được nâng cấp, tuy nhiên, với giá 7,99 triệu đồng sẽ khiến nhiều người phải suy nghĩ khi lựa chọn.

Hãng công nghệ 'lạ mà quen' bất ngờ công bố loạt điều hòa tích hợp AI

1 giờ

Comfort series còn sở hữu chế độ Eco Smart với khả năng học thói quen sử dụng của người dùng.

GS.TS Lê Huy Hàm mở lối công nghệ sinh học cho nông nghiệp Việt

2 giờ

Từ bài toán giống chuối, GS Lê Huy Hàm mở ra hướng đi mới cho công nghệ sinh học, góp phần thay đổi phương thức sản xuất nông nghiệp Việt Nam.

Đường dành riêng cho xe đạp và người đi bộ ở Hà Nội - Góc nhìn của chuyên gia

3 giờ

Đầu năm 2024, TP Hà Nội triển khai tuyến đường dành riêng cho xe đạp chạy dọc theo ven sông Tô Lịch với mục tiêu thúc đẩy người dân sử dụng phương tiện xanh, bảo vệ môi trường... Tuy nhiên, từ khi đi vào khai thác, dự án không phát huy được hiệu quả như kỳ vọng.

Tin mới

iPhone kỷ niệm 20 năm sẽ gây hụt hẫng

6 phút

iPhone phiên bản kỷ niệm 20 năm có thể chưa sở hữu thiết kế tràn viền như đồn đoán, do Apple vẫn gặp khó với công nghệ cảm biến dưới màn hình.

Mong có một 'Hiếu PC thứ hai' trong tương lai

16 phút

Mới đây, Công an tỉnh Thanh Hóa đã phối hợp với Cục An ninh mạng và phòng, chống tội phạm sử dụng công nghệ cao (Bộ Công an) triệt phá đường dây tội phạm công nghệ cao, chuyên tạo lập và phát tán mã độc để đánh cắp dữ liệu người dùng Internet trên toàn thế giới.

Cách nào để ngăn chặn các cuộc tấn công mạng?

17 phút

Theo thống kê, năm 2025 hệ thống thông tin tại Việt Nam đối mặt với 552.000 cuộc tấn công mạng, dù số lượng giảm so với năm trước nhưng tổn hại với doanh nghiệp gia tăng.

Bị nghe lén, theo dõi từ chính thiết bị trong nhà: Loa đài biến thành gián điệp

28 phút

Loa thông minh, thiết bị đang ngày càng phổ biến trong các gia đình, có thể trở thành công cụ do thám nếu rơi vào tay tin tặc, nhật báo hàng đầu nước Nga MK ngày 23/3 dẫn cảnh báo của cơ quan nội vụ và chuyên gia an ninh mạng nước này.

Tin công nghệ 26-3: Sanyo bất ngờ trở lại thị trường Việt Nam

34 phút

Tin công nghệ 26-3 sẽ có các nội dung như Sanyo bất ngờ trở lại thị trường Việt Nam, mẫu TV Mini LED đáng mua nhất phân khúc, Google cho phép tạo bài hát dài đến 3 phút bằng AI.

Hình ảnh cửa hàng vàng Bảo Tín Minh Châu trước giờ mở cửa trưa nay

35 phút

Sau thời gian tạm dừng giao dịch để phối hợp với cơ quan chức năng kiểm tra, hệ thống cửa hàng của Công ty TNHH Bảo Tín Minh Châu thông báo sẽ mở cửa trở lại từ 12h trưa nay (26/3).

Hành trình đưa Ba Lan trở thành quốc gia hàng đầu châu Âu về số hóa

37 phút

Chỉ ba thập kỷ trước, Ba Lan gặp nhiều thách thức kinh tế và công nghệ, nhưng từ năm 1989, Ba Lan bắt đầu hành trình chuyển đổi, nhanh chóng thu hẹp khoảng cách với các quốc gia phương Tây phát triển hơn. Hiện nay, nước này không chỉ bắt kịp nhiều nước phương Tây mà còn nổi lên là quốc gia tiên phong trong một số giải pháp số.

Ghi nhận sau gần một tháng áp dụng quy định kiểm định khí thải ô tô mới

39 phút

Từ ngày 1/3/2026, theo Quyết định số 43 về lộ trình áp dụng quy chuẩn kỹ thuật quốc gia về khí thải xe ô tô tham gia giao thông đường bộ, cơ quan đăng kiểm trên cả nước chính thức thực hiện kiểm định khí thải ô tô theo quy trình, phương pháp mới nhằm bảo đảm kết quả chính xác hơn, đồng thời đáp ứng mục tiêu giảm phát thải, bảo vệ môi trường.