Google ra mắt 4 công cụ AI mới giúp bạn làm phim, tạo nhạc, dựng hình bằng lời nói

Tại sự kiện I/O 2025, Google đã công bố loạt công cụ AI tạo sinh mới, giúp ai cũng có thể trở thành nhà làm phim, họa sĩ hay nhạc sĩ… chỉ bằng vài dòng mô tả.

Theo đó, 4 công cụ AI tạo sinh mới bao gồm Veo 3, Imagen 4, Lyria 2 và Flow. Đây là loạt sản phẩm ứng dụng các mô hình AI tiên tiến từ Google DeepMind, cho phép người dùng dễ dàng tạo ra video, hình ảnh, âm nhạc và thậm chí là cả phim điện ảnh một cách nhanh chóng, sống động và giàu tính sáng tạo.

 Google ra mắt 4 công cụ AI giúp người dùng làm phim, tạo nhạc... dễ dàng hơn. Ảnh: Google

Google ra mắt 4 công cụ AI giúp người dùng làm phim, tạo nhạc... dễ dàng hơn. Ảnh: Google

1. Veo 3: Làm video bằng AI có âm thanh và đối thoại

Veo 3 là phiên bản mới nhất của mô hình tạo video bằng AI từ Google, nổi bật với khả năng tạo video kèm âm thanh, từ tiếng xe cộ, tiếng chim hót đến lời thoại nhân vật.

Bạn chỉ cần mô tả một ý tưởng đơn giản bằng lời (prompt), Veo 3 sẽ biến nó thành một đoạn phim sống động, với hình ảnh sắc nét và hiệu ứng âm thanh chân thực.

Không chỉ hiểu văn bản tốt hơn, Veo 3 còn mô phỏng vật lý thực tế, đồng bộ khẩu hình với giọng nói và tái hiện các chuyển động camera chính xác. Hiện người dùng gói Gemini Ultra tại Mỹ đã có thể trải nghiệm Veo 3 trên ứng dụng Gemini và nền tảng làm phim mới Flow.

Cùng lúc đó, Google cũng nâng cấp Veo 2, phiên bản tiền nhiệm bằng loạt tính năng chuyên biệt cho nhà làm phim.

2. Flow: Dựng phim bằng AI, kiểm soát từng cảnh quay bằng lời nói

Flow là công cụ làm phim hoàn toàn mới, thiết kế riêng cho các nhà sáng tạo. Được xây dựng dựa trên sức mạnh tổng hợp của các mô hình AI gồm Veo, Imagen và Gemini, Flow cho phép bạn viết lời mô tả để tạo cảnh quay điện ảnh hoàn chỉnh, bao gồm nhân vật, bối cảnh, phong cách và bố cục.

Chỉ bằng giọng nói hoặc văn bản, người dùng có thể tạo ra từng cảnh phim với khả năng kiểm soát chi tiết không thua gì các phần mềm dựng phim chuyên nghiệp. Hiện Flow đã khả dụng cho người dùng gói AI Pro và Ultra tại Mỹ và sẽ sớm ra mắt ở các quốc gia khác.

3. Imagen 4: Tạo hình ảnh 2K, chất lượng in ấn, đánh vần chữ không sai

Imagen 4 mang đến độ chi tiết ấn tượng, từ giọt nước nhỏ cho đến từng sợi lông động vật hay họa tiết vải vóc tinh xảo.

Không chỉ phù hợp với cả phong cách siêu thực lẫn trừu tượng, Imagen 4 còn có khả năng sắp xếp chữ cực chuẩn, rất lý tưởng để tạo thiệp chúc mừng, áp phích hay truyện tranh. Mô hình hỗ trợ tạo ảnh ở nhiều tỉ lệ khung hình khác nhau, độ phân giải lên đến 2K, đủ chất lượng để dùng trong in ấn hoặc thuyết trình.

Hiện Imagen 4 đã được tích hợp vào Gemini, Whisk, Vertex AI và các ứng dụng thuộc Google Workspace như Slides, Vids và Docs. Google cũng hé lộ phiên bản tốc độ cao gấp 10 lần so với Imagen 3 sẽ sớm ra mắt.

4. Lyria 2: Sáng tác nhạc trực tiếp với AI, không giới hạn thể loại

Lyria 2, mô hình AI tạo nhạc mới, giúp người dùng sáng tác bài hát, hòa âm phối khí hoặc tạo hiệu ứng âm thanh một cách linh hoạt và đầy sáng tạo.

Thông qua Music AI Sandbox và công cụ MusicFX DJ, bạn có thể tương tác với AI theo thời gian thực, yêu cầu thay đổi giai điệu, tốc độ, nhạc cụ chỉ bằng vài dòng mô tả. Tính năng này hiện đã mở cho người dùng YouTube Shorts và doanh nghiệp trong Vertex AI.

Chống giả mạo AI

Để bảo vệ người dùng khỏi thông tin giả mạo, Google tích hợp SynthID, công nghệ đánh dấu (watermark) vào tất cả nội dung do các mô hình như Veo 3, Imagen 4 hay Lyria 2 tạo ra. Tính đến nay, hơn 10 tỉ ảnh, video, âm thanh và văn bản đã được gắn dấu.

Không chỉ dành cho nghệ sĩ hay kỹ thuật viên, các công cụ AI tạo sinh mới của Google đang mở ra cánh cửa sáng tạo cho tất cả mọi người. Từ học sinh, nhà sáng tạo nội dung đến doanh nghiệp nhỏ, bất kỳ ai cũng có thể hiện thực hóa ý tưởng của mình thành hình ảnh, âm nhạc hay phim ngắn với chất lượng chuyên nghiệp, nhanh chóng, dễ dàng và đầy cảm hứng.

Tiểu Minh

Nguồn PLO: https://plo.vn/google-ra-mat-4-cong-cu-ai-moi-giup-ban-lam-phim-tao-nhac-dung-hinh-bang-loi-noi-post850843.html