Startup TQ tạo ra 'Google dịch của video', hoán đổi được mặt và giọng

Không chỉ hoán đổi khuôn mặt, phần mềm của Surreal còn có thể dịch ngôn ngữ, khớp khẩu hình với giọng nói.

Theo Tech Crunch, nhiều tiến bộ kỹ thuật tưởng chừng chỉ có trong phim viễn tưởng như dựng clip bằng thuật toán, video giả dạng người nổi tiếng bằng công nghệ deep fake, học máy, đang ngày càng trở nên phổ biến.

Surreal - công ty có trụ sở tại Trung Quốc do Xu Zhao và Wang Liang, cựu nhân viên của ByteDance sáng lập - đang nghiên cứu công nghệ tương tự để tạo ra hình ảnh, video thông qua AI.

Ứng dụng quay, tạo video hoán đổi gương mặt của Surreal. Ảnh: Tech Crunch.

"Google dịch của video"

Mới thành lập được ba tháng, Surreal đã kêu gọi được khoảng 2-3 triệu USD từ Sequoia China và ZhenFund. Start-up này nhận được gần mười lời đề nghị đầu tư chỉ trong vòng gọi vốn đầu tiên.

Nhà đồng sáng lập Xu Zhuo đã có 6 năm góp phần xây dựng hệ thống đề xuất quảng cáo, nền tảng máy học và camera AI tại Snap. Bằng kinh nghiệm có được, Xu Zhuo cho rằng các sản phẩm truyền thông do AI tạo ra sẽ trở thành xu hướng trong tương lai, bởi tiết kiệm chi phí sản xuất.

Tuy nhiên, công ty cho biết không có ý định thay thế nghệ sĩ, những người sáng tạo nội dung hoàn toàn, vì máy móc không thể vượt qua khả năng con người, ít nhất là trong vài thập kỷ tới. “Công thức chung của kể chuyện bằng hình ảnh là sáng tạo cộng với cách thực hiện. Chúng tôi chỉ tập trung vào phần tạo dựng”, Xu Zhao chia sẻ.

Tạo dựng video bằng công nghệ là bước cải tiến so với công cụ chỉnh sửa video hiện tại ở các ứng dụng như hiện nay. “Trọng tâm của video ngắn không phải ở lượng thời gian, mà là công nghệ camera tốt hơn, giúp giảm chi phí”, Xu Zhao cho biết.

Những ông lớn công nghệ như Google, Facebook, Tencent và ByteDance cũng có các nhóm nghiên cứu tương tự. Chiến lược của Surreal là tránh đối đầu đối thủ nặng ký, tập trung hướng tới nhóm khách hàng vừa và nhỏ.

 Bằng phương pháp chuyển điểm gương mặt, thông qua mạng đối nghịch tạo sinh, AI đã có thể tạo ra những gương mặt như người thật. Ảnh: The Verge.

Bằng phương pháp chuyển điểm gương mặt, thông qua mạng đối nghịch tạo sinh, AI đã có thể tạo ra những gương mặt như người thật. Ảnh: The Verge.

Phần mềm của Surreal hiện chỉ dành cho khách hàng doanh nghiệp. Xu Zhao gọi Surreal là “Google Dịch cho video” vì phần mềm không chỉ hoán đổi khuôn mặt, nó còn có thể dịch ngôn ngữ, khớp khẩu hình với giọng nói.

Công ty tính phí trên video, hình ảnh. Trong tương lai, Surreal muốn chỉnh sửa cả quần áo và chuyển động nhân vật. Dù từ chối tiết lộ hoạt động tài chính, Xu Zhao cho biết công ty đã nhận được khoảng 10 triệu đơn đặt hàng.

Phần lớn nhu cầu đến từ các nền tảng thương mại điện tử Trung Quốc, dùng Surreal để đổi mặt người mẫu trong nước thành phương Tây khi tiếp cận thị trường quốc tế, do thuê mẫu nước ngoài rất tốn kém. Theo Xu Zhao, nhiều doanh nghiệp dễ dàng hoàn vốn khi dùng mẫu phương Tây thay cho người châu Á.

Với số vốn đầu tư lớn, trong tương lai, Surreal dự định ra mắt phần mềm trong lĩnh vực khác như giáo dục trực tuyến, thu thập thêm dữ liệu nhằm cải thiện thuật toán.

Lợi bất cập hại

Công nghệ Surreal sử dụng, tạm gọi là mạng đối nghịch tạo sinh (generative adversarial networks - GAN), vẫn còn khá mới mẻ. Công nghệ này thường được dùng để lừa đảo, làm video khiêu dâm hoặc các mục đích bất hợp pháp khác. Đó cũng là nguyên nhân Surreal chỉ mới cung cấp sản phẩm cho doanh nghiệp thay vì cá nhân.

GAN cũng làm phát sinh nhiều vấn đề pháp lý như chủ thể nào sở hữu hình ảnh và video tạo ra? Để tránh vi phạm bản quyền, Surreal yêu cầu khách hàng phải tự kiểm duyệt trước nội dung chỉnh sửa trước khi đăng tải.

Có một khả năng khác là hình ảnh do phần mềm tạo ra sẽ giống với ai đó ngoài đời thực. Để khắc phục, công ty cho chạy thuật toán dò tìm các bức ảnh trên mạng để xem có khớp với khuôn mặt do Surreal tạo dựng hay không.

 Cựu Tổng thống Mỹ Obama từng bị diễn viên hài Jordan Peele giả dạng thông qua công nghệ deep fake. Ảnh: The Verge.

Cựu Tổng thống Mỹ Obama từng bị diễn viên hài Jordan Peele giả dạng thông qua công nghệ deep fake. Ảnh: The Verge.

Hoán đổi khuôn mặt từ lâu đã bị lạm dụng để tạo ra các video nhằm hạ uy tín, phỉ báng nhân vật có ảnh hưởng.

Tháng 3/2018, một video deep fake trở nên phổ biến trên mạng xã hội khi gương mặt Đệ nhất phu nhân Mỹ Michelle Obama bị ghép vào nhân vật phim khiêu dâm.

Không lâu sau, tháng 6/2018, xuất hiện video giả danh phát ngôn của ông chủ Facebook Mark Zuckerberg.

Những nhà lãnh đạo như cựu Tổng thống Mỹ Donald Trump hay Chủ tịch Quốc hội Mỹ Nancy Pelosi cũng là nạn nhân của deep fake.

Nữ diễn viên Scarlett Johansson từng xuất hiện trong hàng chục video ghép mặt trên các trang phim khiêu dâm. Trước đó, cô từng bị lấy trộm ảnh nhạy cảm trong điện thoại, khuôn mặt ghép với robot.

Đại Việt

Tech Crunch, The Verge

Nguồn Znews: https://zingnews.vn/hang-tq-ban-phan-mem-quay-video-hoan-doi-khuon-mat-post1188939.html