Đối thủ của OpenAI ra mắt mô hình tạo video AI 'siêu mượt'
Trong video công bố mới đây, mô hình tạo video mới có tên Gen-4 thể hiện khả năng duy trì tính nhất quán về nhân vật, phong cách và địa điểm. Đây là những điều mà các công cụ tạo video AI trước đây chưa làm được.
Một số cảnh quay do Gen-4 tạo ra. Video: Runway.
Gen-4 được phát triển bởi Runway, một startup trong lĩnh vực AI. Công cụ này sử dụng tài liệu tham khảo trực quan gồm ảnh, video kết hợp câu lệnh văn bản để kiểm soát kết quả. Cùng với đó, Gen-4 có thể tạo chính xác nhân vật, địa điểm, sau đó sắp xếp cảnh quay một cách mượt mà từ nhiều góc nhìn khác nhau. Điều này giúp video trở nên liền mạch, giữ nguyên phong cách, tâm trạng và các yếu tố điện ảnh đặc trưng của từng khung hình trong suốt video, theo thông tin từ Runway.
“Video do AI tạo ra thường gặp khó khăn khi duy trì tính nhất quán trong việc kể chuyện. Tuy nhiên, với cách sử dụng tài liệu tham khảo trực quan kết hợp câu lệnh hướng dẫn, Gen-4 cho phép người dùng tạo hình ảnh và video với phong cách, chủ đề, địa điểm thống nhất, liên tục,” đại diện của Runway cho biết.
Các chuyên gia công nghệ của The Verge đánh giá, các đoạn phim trong video do Gen-4 tạo ra vượt trội hơn so với các trình tạo video AI khác như Sora của OpenAI về độ liền mạch và nhất quán trong video.
Các mô hình AI tạo video như Sora thường có hạn chế trong việc duy trì sự nhất quán của nhân vật, đối tượng hoặc phong cách qua nhiều cảnh quay khác nhau trong một video dài. Nhân vật có thể thay đổi ngoại hình, trang phục hoặc bối cảnh có thể biến đổi một cách bất hợp lý, theo The Verge.
Hiện Gen-4 được triển khai cho người dùng trả phí và doanh nghiệp. Để sử dụng, người dùng truy cập vào công cụ của Runway, nhập câu lệnh hoặc tải lên ảnh tham chiếu, sau đó mô tả bố cục mong muốn.