Financial Times: Công ty Trung Quốc vượt các đối thủ Mỹ trong lĩnh vực tạo video bằng AI
Với dữ liệu lớn và chi phí thấp, các công ty Trung Quốc như ByteDance và Kuaishou hiện dẫn đầu trong AI tạo video, thay đổi cuộc chơi công nghệ số.

Các công ty AI Trung Quốc hiện đã dẫn đầu về công nghệ tạo video AI nhờ dữ liệu lớn và chi phí thấp. Ảnh: Sohu.
Báo Anh Financial Times (Thời báo Tài chính) ngày 18/5 đăng bài cho rằng các nhóm trí tuệ nhân tạo (AI) của Trung Quốc hiện đã vượt qua các đối thủ Mỹ trong lĩnh vực tạo video bằng AI. Bài báo cho rằng tạo video là một trong những “chiến trường then chốt” của AI tạo sinh, đang nhanh chóng được ứng dụng trong quảng cáo, thương mại điện tử và ngành giải trí.
Bài viết cho biết các công ty Trung Quốc như ByteDance và Kuaishou đang tận dụng kho dữ liệu video ngắn khổng lồ để huấn luyện mô hình AI, qua đó tạo được lợi thế so với các công ty Mỹ. Theo bài báo, sự thay đổi này đánh dấu một bước ngoặt trong cuộc đua AI. Dù OpenAI, Google và Anthropic vẫn dẫn đầu trong các mô hình ngôn ngữ lớn và AI lập trình, nhưng về chất lượng và tính thực dụng của công cụ tạo video thì đã tụt lại phía sau các sản phẩm của Trung Quốc.

Công cụ tạo video bằng AI của Trung Quốc “Kling 3.0” cùng loạt mô hình liên quan đã được ra mắt vào tháng 2/2026. Ảnh: Worldjournal.
Bài báo nhận định việc huấn luyện mô hình video cần lượng lớn dữ liệu chất lượng cao, trong khi các nền tảng video ngắn của Trung Quốc sở hữu ưu thế rõ rệt nhờ dữ liệu do chính người dùng tạo ra. Một số chuyên gia cũng cho rằng Mỹ tụt hậu trong mảng tạo video AI phần nào do các quy định bản quyền nội dung nghiêm ngặt hơn.
Ông Ben Chiang, người sáng lập Director AI,một start-up chuyên sản xuất nội dung hoạt hình và phim truyền hình ngắn bằng AI ở Los Angeles, cho biết: “Phần lớn các mô hình Mỹ mà chúng tôi thử nghiệm đều hoạt động không tốt trong việc tạo video”. Công ty này chủ yếu sử dụng mô hình Kling do Kuaishou phát triển, đồng thời cũng chuyển đổi giữa Seedance 2.0 của ByteDance và Hailuo của startup MiniMax tùy theo yêu cầu công việc và chi phí.

Ben Chiang, người sáng lập Director AI, một start-up ở Mỹ chuyên sản xuất nội dung hoạt hình và phim truyền hình ngắn bằng AI thừa nhận sử dụng các mô hình của Trung Quốc. Ảnh: UDN.
Bài báo cho biết Kling, Seedance 2.0 và Huanlema của Alibaba Group đều nằm trong nhóm đầu bảng xếp hạng mô hình video tốt nhất trên Arena. Bảng xếp hạng này dựa trên bình chọn của người dùng trên một nền tảng độc lập, và được xem là phản ánh hiệu quả thực tế tốt hơn một số hệ thống benchmark truyền thống (tức hệ thống dùng để đo lường và so sánh hiệu năng của một công nghệ, phần mềm hoặc mô hình AI theo các tiêu chuẩn nhất định).
Tuy nhiên, mô hình Veo 3 của Google cũng được đánh giá có sức cạnh tranh mạnh. Các chuyên gia cho rằng ưu thế của công cụ này là có thể tiếp cận nguồn dữ liệu video khổng lồ từ YouTube, dù đồng thời áp dụng nhiều biện pháp bảo vệ nội dung và hạn chế nghiêm ngặt hơn đối với nhà phát triển.
Bài báo nhấn mạnh rằng ByteDance và Kuaishou đang vận hành những nền tảng video ngắn lớn nhất thế giới, cho phép họ tiếp cận lượng dữ liệu video độc quyền khổng lồ - một lợi thế huấn luyện mà các đối thủ khó sao chép. So với dữ liệu văn bản, dữ liệu video cũng khó bị thu thập hàng loạt hơn.
Video AI do mô hình Seedance 2.0 của Trung Quốc tạo ra. Nguồn: Ifeng.
Ngoài ra, chi phí tính toán để tạo video AI cao hơn nhiều so với văn bản hoặc âm thanh, khiến việc triển khai quy mô lớn rất tốn kém. Đối với các nhà sáng tạo cá nhân, công cụ của Trung Quốc thường rẻ hơn, linh hoạt hơn và hỗ trợ cả mô hình thuê bao lẫn trả phí theo nhu cầu, giúp thử nghiệm nhanh chóng.
Bài báo cũng cho rằng chất lượng của các công cụ video AI Trung Quốc đã cải thiện nhanh chóng trong thời gian gần đây, mở ra nhiều cơ hội kinh doanh mới. Ông Dương Văn Sâm, CEO của Firework, công ty cung cấp hạ tầng video cho các trang thương mại điện tử cho biết trước đây các video AI “gượng gạo và cứng nhắc”, khó đạt tiêu chuẩn thương hiệu, nhưng hiện nay đã phát triển đến mức khó phân biệt đâu là người thật và đâu là video do AI tạo ra.
Ông lấy ví dụ, từng có một nhà bán lẻ yêu cầu tạo 100.000 video cho các trang quảng bá sản phẩm; nếu không có AI thì chi phí gần như không thể chấp nhận được. Nhưng giờ đây, mỗi sản phẩm đều có thể sở hữu video riêng, thậm chí có thể tạo nhiều phiên bản khác nhau cho từng nhóm khách hàng mục tiêu.











