Trung Quốc dẫn đầu thế giới về video tạo sinh bằng AI

Theo nhật báo Corriere della Sera, Chính phủ Mỹ năm 2022 từng tung ra lệnh trừng phạt công nghệ được coi là 'mạnh tay' nhất lịch sử, khi cấm xuất khẩu các dòng chất bán dẫn cao cấp sang Trung Quốc, với mục tiêu làm suy yếu năng lực phát triển trí tuệ nhân tạo (AI) của Bắc Kinh.

Tuy nhiên, đến năm 2026, thị trường AI đang chứng kiến một thực tế đảo chiều, với các tập đoàn công nghệ Trung Quốc đang vượt mặt Silicon Valley để độc chiếm lĩnh vực video tạo sinh.

"Made in China" thống trị các bảng xếp hạng điện ảnh AI

Trong khi OpenAI, Google và Anthropic vẫn nắm giữ thế thượng phong ở mảng mô hình ngôn ngữ lớn (LLM), tạo ảnh và lập mã, ở mảng video, các công cụ của các Big Tech này lại tỏ ra hụt hơi về cả chất lượng lẫn độ mượt. Hiện vị trí dẫn đầu thế giới thuộc về ba đại diện hoàn toàn của Trung Quốc là Seedance 2.0 (ByteDance), Kling 3.0 (Kuaishou) và HappyHorse 1.0 (Alibaba).

Sự vượt trội lớn đến mức các nhà làm phim độc lập và các startup phương Tây đang phải thầm lặng bỏ qua những công cụ nội địa để chuyển sang sử dụng phần mềm Trung Quốc. Phát biểu trên tờ Financial Times,ông Ben Chiang - người sáng lập startup chuyên sản xuất phim hoạt hình Director AI, thừa nhận: "Phần lớn các mô hình của Mỹ mà chúng tôi dùng thử đều không có khả năng xử lý video tốt. Hiện tại chúng tôi phải dùng Kling và Seedance 2.0 tùy dự án. Tất cả nằm ở chất lượng và mức độ mô hình hiểu sát câu lệnh".

Một sinh viên dùng thử công cụ AI ở một hội thảo tại Bắc Kinh năm 2019. Ảnh: ChinaDaily

Một sinh viên dùng thử công cụ AI ở một hội thảo tại Bắc Kinh năm 2019. Ảnh: ChinaDaily

Đồng quan điểm, nhà làm phim độc lập George Won đang làm việc tại Tbilisi (Gruzia) cho biết Seedance 2.0 đã thay đổi hoàn toàn quy trình làm việc của ông nhờ năng lực xử lý những góc máy di chuyển cực nhanh, táo bạo mà không làm mất chi tiết ánh sáng hay làm nhòa khuôn mặt nhân vật - điều mà các mô hình AI của Mỹ thường xuyên vấp phải.

Tư duy "mở"

Bài viết đặt câu hỏi vì sao Trung Quốc lại thắng trong cuộc đua nghẹt thở này, dù bị siết chặt nguồn cung vi mạch.Lời đáp không nằm ở phần cứng, mà ở dữ liệu. Cụ thể, ByteDance và Kuaishou đang nắm giữ các nền tảng video ngắn có lượng người dùng lớn nhất thế giới là TikTok và Kwai. Đây chính là "nguồn" khổng lồ dùng để huấn luyện AI mà không công ty Mỹ nào có được.

Ngoài ra, các công cụ của Mỹ như Google Veo 3 (dù được học từ YouTube) đang bị trói buộc bởi vô số quy định bảo mật và điều khoản sử dụng quá khắt khe. Theo đó, các nhà làm phim liên tục gặp lỗi bị từ chối lệnh hệ thống mà không có giải thích, trong khi AI của Trung Quốc cho phép người dùng tự do sáng tạo với rất ít bộ lọc hạn chế.

Sức mạnh công nghệ vượt trội tính đến năm 2026 cũng là một nguyên nhân khác. Chẳng hạn, công cụ Seedance 2.0 giúp tạo ra các đoạn phim cực thực dài 15s với độ phân giải 1080p, đồng bộ hóa âm thanh sống động ngay trong một bước xử lý duy nhất mà không bị lỗi lệch khớp khẩu hình. Trong khi đó, Kling 3.0 có thể giả lập xuất sắc các định luật vật lý (sự chuyển động tự nhiên của làn nước, mái tóc), hỗ trợ quay liền mạch 6 góc máy tự động như một đạo diễn thực thụ và tích hợp chất lượng 4K ở tốc độ 60 khung hình/giây. Hay như HappyHorse 1.0 có thể tạo video có lời thoại khớp khẩu hình bằng 7 thứ tiếng kèm âm thanh môi trường chuẩn xác ngay lập tức mà không cần qua bất kỳ khâu hậu kỳ tách biệt nào.

"Short Drama" - Cuộc cách mạng tỷ USD

Sự bùng nổ của video AI Trung Quốc đã sản sinh một ngành công nghiệp giải trí hoàn toàn mới. Đó là short drama (phim truyền hình ngắn) - những phim dài 1-2 phút/tập với tình tiết dồn dập, được sản xuất 100% bằng AI mà không cần đến bất kỳ diễn viên, máy quay hay trường quay thực tế nào. Theo báo cáo của MIT Technology Review, ngành công nghiệp phim ngắn AI này đã đạt giá trị 11 tỷ USD toàn cầu và dự kiến chạm mốc 14 tỷ USD vào cuối năm 2026, trong đó riêng thị trường Mỹ đóng góp tới 1,5 tỷ USD.

Để xâm nhập thị trường phương Tây, các doanh nghiệp Trung Quốc áp dụng chiến lược đẩy quảng cáo dồn dập trên Facebook, YouTube và TikTok bằng những đoạn phim cắt lửng để thu hút tò mò, sau đó thu phí người dùng để mở khóa các tập tiếp theo. Sự chuyển dịch này cũng làm xuất hiện một vị trí việc làm vô cùng đắt giá trong studio. Đó là "nhà giám tuyển tài nguyên AI".

Ngoài ra, ngành công nghiệp mới này đã tạo nên sự thay đổi trong tư duy biên kịch. Trước đây, biên kịch chỉ cần viết chỉ dẫn cảm xúc đơn giản như "Cô ấy ném cho anh ta một cái nhìn băng giá". Giờ đây, để điều hướng AI thay thế vai trò của đạo diễn hình ảnh, họ sẽ phải viết câu lệnh kỹ thuật cực kỳ chi tiết: "Từ đôi mắt cô ấy bừng ra những tia sáng mang luồng khí lạnh".

Cú ngược dòng đầy thành công của các tập đoàn công nghệ Trung Quốc trong việc phát triển video AI tạo sinh là minh chứng rõ ràng nhất cho thấy trong kỷ nguyên AI, quyền lực tối thượng không chỉ nằm ở card đồ họa đắt tiền của Mỹ, mà nằm ở khả năng làm chủ nguồn dữ liệu hành vi khổng lồ của thời đại số.

Việt Hải (P/v TTXVN tại Rome)

Nguồn Báo Thể Thao & Văn Hóa: https://thethaovanhoa.vn/trung-quoc-dan-dau-the-gioi-ve-video-tao-sinh-bang-ai-20260615072907528.htm