Seedance 2.0, Kling 3.0 giúp Trung Quốc vượt Mỹ về tạo video AI

Mô hình AI tạo video của ByteDance, Kuaishou được đánh giá vượt trội các đối thủ Mỹ về độ chân thực và khả năng mở rộng.

Đây là sự thay đổi có thể làm đảo lộn ngành sáng tạo nội dung và quảng cáo.

Các công ty Trung Quốc đã vượt qua đối thủ Mỹ trong lĩnh vực tạo video bằng AI. Đây là lĩnh vực quan trọng của AI tạo sinh đang được ứng dụng rất nhanh trong quảng cáo, thương mại điện tử và giải trí.

Những công ty Trung Quốc như ByteDance và Kuaishou đang huấn luyện AI bằng kho dữ liệu video ngắn khổng lồ, giúp họ có lợi thế lớn hơn các đối thủ Mỹ. Điều này đánh dấu một bước ngoặt trong cuộc đua AI.

Ba công ty Mỹ là OpenAI, Google, Anthropic vẫn dẫn đầu về các mô hình ngôn ngữ lớn và lĩnh vực lập trình. Tuy nhiên, mô hình AI tạo video của Google lại tụt hậu so với các đối thủ Trung Quốc về chất lượng và khả năng sử dụng, theo các nhà phát triển và nhiều bảng xếp hạng.

Trong khi đó, OpenAI đã khai tử Sora, còn Anthropic không phát triển mô hình AI tạo video riêng.

Seedance 2.0 của ByteDance, HappyHorse 1.0 của Alibaba, Kling 3.0 của Kuaishou dẫn đầu bảng xếp hạng mô hình AI chuyển văn bản thành video của Artificial Analysis. Ảnh chụp màn hình

Seedance 2.0 của ByteDance, HappyHorse 1.0 của Alibaba, Kling 3.0 của Kuaishou dẫn đầu bảng xếp hạng mô hình AI chuyển văn bản thành video của Artificial Analysis. Ảnh chụp màn hình

Lợi thế dữ liệu video giúp ByteDance và Kuaishou vượt đối thủ Mỹ

Việc huấn luyện mô hình AI tạo video đòi hỏi lượng lớn cảnh quay chất lượng cao. Đây là lợi thế của các nền tảng Trung Quốc vì họ sở hữu nhiều ứng dụng video ngắn, nổi bật là TikTok, cùng kho dữ liệu khổng lồ do người dùng tạo ra.

Một số chuyên gia cho rằng các công ty Trung Quốc cũng đã tích cực hơn trong việc khai thác các nội dung có bản quyền.

“Phần lớn mô hình AI của Mỹ mà chúng tôi thử đều tạo video không tốt”, Ben Chiang, nhà sáng lập startup Director AI chuyên sản xuất hoạt hình và phim ngắn bằng AI, cho biết. Ông nói các quy định kiểm soát nội dung nghiêm ngặt khiến mô hình AI Mỹ bị hạn chế và thường tạo ra video kém chân thực hơn.

Director AI chủ yếu dùng Kling của Kuaishou, đồng thời linh hoạt chuyển sang Seedance 2.0 của ByteDance hoặc Hailuo của MiniMax tùy theo tác vụ và chi phí.

“Quan trọng nhất là chất lượng và mức độ mô hình AI hiểu đúng yêu cầu người dùng”, Ben Chiang nói thêm. Theo ông, những tiến bộ gần đây đã giúp các mô hình AI dễ sử dụng hơn, đặc biệt là trong việc đồng bộ hóa âm thanh và ổn định giọng nói.

Với các nhà sáng tạo nội dung, những cải tiến này đang làm thay đổi hoàn toàn quy trình sản xuất video. George Won, nhà làm phim AI độc lập ở Tbilisi (thủ đô Georgia), nói: “Seedance 2.0 thực sự mở rộng tự do sáng tạo cho tôi. Nó xử lý tốt các góc quay khó và chuyển động tốc độ cao mà không làm biến dạng khuôn mặt nhân vật hay ánh sáng. Nhiều mô hình AI khác thường bị rung hoặc lệch hình khi cảnh quay chuyển động nhanh”.

Seedance 2.0, Kling 3.0 và HappyHorse 1.0 của Alibaba đều đạt điểm rất cao trên bảng xếp hạng Arena về các mô hình AI tạo video tốt nhất, được tổng hợp dựa trên bình chọn của người dùng.

Những đánh giá như vậy được coi là đáng tin cậy hơn hầu hết hệ thống đánh giá hiệu năng mô hình AI, vốn được các công ty tối ưu hóa để đạt điểm cao nhưng không phản ánh đúng hiệu quả thực tế.

Mô hình Veo 3.1 của Google cũng được đánh giá cao nhờ lợi thế tiếp cận kho video khổng lồ từ YouTube. Tuy nhiên, Veo 3 có nhiều cơ chế bảo vệ và giới hạn việc tạo video AI hơn với nhà phát triển.

Các công ty Trung Quốc tiến bộ nhanh chóng nhờ kho dữ liệu video độc quyền khổng lồ. ByteDance và Kuaishou vận hành những nền tảng video ngắn lớn nhất thế giới, tạo ra lợi thế huấn luyện AI rất khó sao chép, đặc biệt là khi video không thể bị thu thập dữ liệu hàng loạt dễ dàng như văn bản.

Tuần này, Kuaishou thông báo đang xem xét tách riêng mảng Kling và có thể niêm yết độc lập để tận dụng sự bùng nổ của thị trường video AI.

Nhiều nhà phát triển và nhà sáng tạo cho biết các mô hình AI Trung Quốc dễ dùng hơn nhờ quy định nội dung ít khắt khe hơn. Ben Chiang nói các mô hình AI Mỹ “liên tục báo lỗi”, từ chối yêu cầu vì vi phạm điều khoản sử dụng nhưng không giải thích rõ lý do.

Tuy nhiên, việc sử dụng dữ liệu video cũng gây tranh cãi. ByteDance từng bị dọa kiện vì cho phép người dùng tạo video chứa nhân vật từ phim Marvel hay series phim hoạt hình South Park mà chưa có giấy phép phù hợp. Công ty mẹ TikTok cam kết sẽ tăng cường bảo vệ bản quyền.

Infographic: SV

Infographic: SV

Chi phí dùng mô hình AI tạo video Trung Quốc rẻ hơn của Mỹ

Với nhà sáng tạo cá nhân, mô hình AI tạo video của Trung Quốc thường rẻ hơn và linh hoạt hơn đối thủ phương Tây, nhờ các gói đăng ký hoặc trả tiền theo mức sử dụng, cho phép thử nghiệm nhanh chóng. Tuy nhiên, nhu cầu quá lớn với Seedance 2.0 từ tháng 2 đã khiến nhiều người dùng bị hạn chế lượt sử dụng hoặc phải chờ lâu.

Với khách hàng doanh nghiệp, ByteDance lại áp dụng cách tiếp cận khác. Theo nguồn tin của FT, một số khách hàng Mỹ phải cam kết trả trước khoảng 2 triệu USD để được cấp quyền truy cập Seedance 2.0 và hạn mức sử dụng. ByteDance chưa phản hồi về thông tin này.

Một số người dùng vượt qua rào cản bằng cách truy cập Seedance 2.0 thông qua các nền tảng trung gian như BeHooked, nơi cung cấp cách tính phí khác.

Tạo video bằng AI cần lượng token xử lý dữ liệu lớn hơn rất nhiều so với văn bản hay âm thanh, khiến chi phí triển khai quy mô lớn cực kỳ đắt đỏ. Tháng 3, OpenAI đã ngừng cung cấp mô hình AI tạo video Sora một phần vì chi phí tính toán quá cao.

Trong AI, token là đơn vị dữ liệu nhỏ nhất mà mô hình xử lý hoặc tạo ra, có thể là một từ, một phần của từ, hoặc thậm chí là dấu câu. Nhiều công ty sử dụng token như một đơn vị kinh tế để đo lường khối lượng tính toán mà AI thực hiện. Văn bản càng dài thì càng cần nhiều token để xử lý, vì vậy chi phí thường được tính theo số token (trên mỗi nghìn hoặc mỗi triệu token).

Cơ hội lớn cho ngành quảng cáo

Với các công ty ứng dụng mô hình AI tạo video phát triển sản phẩm và dịch vụ, bước nhảy vọt về chất lượng sẽ mở ra cơ hội kinh doanh lớn.

“Trước đây, video AI rất giả và cứng nhắc, không đạt tiêu chuẩn thương hiệu. Bây giờ đã đến mức khó phân biệt đâu là video AI, đâu là video do con người làm”, theo Vincent Yang - Giám đốc điều hành Firework - công ty cung cấp hạ tầng video cho các website thương mại điện tử.

Vincent Yang nói công nghệ này đang thay đổi ngành quảng cáo vì cho phép các thương hiệu tạo video ở quy mô chưa từng có.

“Một nhà bán lẻ từng yêu cầu chúng tôi tạo 100.000 video cho các trang sản phẩm. Nếu không có AI thì chi phí làm việc này sẽ rất lớn. Giờ đây, mỗi sản phẩm đều có video riêng, thậm chí nhiều phiên bản khác nhau cho từng nhóm khách hàng”, ông cho hay.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/seedance-2-0-kling-3-0-giup-trung-quoc-vuot-my-ve-tao-video-ai-251787.html