Google tung Gemini Omni, AI tạo video từ mọi dữ liệu đầu vào

Google vừa công bố Gemini Omni tại sự kiện Google I/O 2026, mở rộng tham vọng đưa AI tiến gần hơn tới quá trình sản xuất nội dung hoàn chỉnh. Mô hình mới kết hợp suy luận, nhận biết bối cảnh cùng năng lực sáng tạo đa phương thức, cho phép tạo video từ văn bản, hình ảnh, âm thanh hoặc tư liệu video chỉ trong một quy trình thống nhất.

1 giờ trước Gốc

Google gọi Omni là mô hình “có thể sáng tạo mọi thứ từ bất kỳ đầu vào nào”. Hướng triển khai đầu tiên tập trung vào video, lĩnh vực vốn đòi hỏi AI xử lý đồng thời hình ảnh, chuyển động, âm thanh cùng logic kể chuyện. Trong phần trình diễn tại sự kiện, Gemini Omni tiếp nhận nhiều dạng dữ liệu khác nhau rồi tự đồng bộ thành một đoạn video hoàn chỉnh, giữ xuyên suốt nhân vật, bối cảnh và diễn biến giữa các phân cảnh.

Khác nhiều công cụ tạo video AI trước đây vốn phụ thuộc mạnh vào câu lệnh văn bản, Gemini Omni mở rộng khả năng tương tác tự nhiên hơn. Người dùng chỉ cần trò chuyện trực tiếp với mô hình để chỉnh sửa chi tiết video, thay đổi góc quay, bổ sung vật thể hoặc điều chỉnh diễn biến. Cách vận hành này cho thấy Google muốn biến AI thành một “bàn dựng số” thay cho công cụ xử lý từng tác vụ rời rạc.

Google Gemini Omni. Ảnh: Google

Điểm đáng chú ý nằm ở khả năng suy luận bối cảnh. Theo Google, Omni không chỉ dựng hình từ dữ liệu đầu vào mà còn hiểu mối liên hệ giữa vật thể, chuyển động cùng các quy luật vật lý trong môi trường thực tế. Hệ thống ghi nhớ diễn biến trước đó, duy trì tính nhất quán giữa các khung hình và dự đoán bước chuyển tiếp tiếp theo của câu chuyện. Đây cũng là khác biệt quan trọng giữa video AI mang tính minh họa với video có cấu trúc kể chuyện hoàn chỉnh.

Google DeepMind cho biết mô hình tận dụng kho dữ liệu tri thức của Gemini về lịch sử, khoa học và văn hóa để tăng chiều sâu nội dung. Omni đồng thời cải thiện khả năng mô phỏng trọng lực, động năng hay chuyển động chất lưu, yếu tố từng khiến nhiều video AI trước đây tạo cảm giác thiếu tự nhiên. Sau mô hình tạo ảnh Nano Banana ra mắt năm ngoái, Omni cho thấy Google đang đẩy nhanh tốc độ cạnh tranh trong cuộc đua AI sáng tạo nội dung.

Song song khả năng sáng tạo, Google cũng siết kiểm soát xác thực nội dung. Tất cả video tạo bằng Omni đều gắn dấu mờ kỹ thuật số vô hình SynthID cùng chứng chỉ C2PA nhằm hỗ trợ truy xuất nguồn gốc nội dung qua Gemini hoặc Google Search. Hãng hiện giới hạn tính năng chỉnh sửa giọng nói bằng chính âm thanh gốc của người dùng nhằm giảm nguy cơ giả mạo phát ngôn và deepfake.

Phiên bản đầu tiên mang tên Gemini Omni Flash đã bắt đầu triển khai cho người dùng đăng ký Google AI Pro và Ultra thông qua ứng dụng Gemini cùng Google Flow. Google đồng thời mở miễn phí công cụ này trên YouTube Shorts và YouTube Create từ tuần này trước khi mở rộng sang nhóm phát triển và khách hàng doanh nghiệp.

Minh Đức

Nguồn Điện tử & Ứng dụng: https://dientuungdung.vn/google-tung-gemini-omni-ai-tao-video-tu-moi-du-lieu-dau-vao-15275.html

Đế chế AI trị giá hơn 300 tỷ USD của Google đang có những gì?

6 giờ

CEO Google DeepMind nói về điểm kỳ dị AI và 4 điểm nổi bật ở I/O 2026

Gemini 3.5 Flash gây sốt vì có thể xử lý nhiều yêu cầu 'rối rắm' ngoài đời thật

6 giờ

Tin nóng

Tiềm ẩn nhiều rủi ro từ trào lưu xăm thông tin hiến tạng lên cơ thể

4 giờ

Trào lưu xăm thẻ hiến tạng lên tay đang gây sốt nhưng cũng vấp phải nhiều cảnh báo lo ngại về nguy cơ lộ dữ liệu cá nhân và trở thành mục tiêu của tội phạm.

Thuê bao có thể bị ngừng dịch vụ nếu chưa làm bước này trên VNeID

6 giờ

Dù đã chuẩn hóa thông tin với nhà mạng, nhiều người dùng vẫn cần xác thực số điện thoại trên VNeID để tránh nguy cơ bị ngừng dịch vụ.

Chung tay bảo tồn cây thuốc nam, gìn giữ tri thức y học dân tộc

5 phút

Ngày 21/5, tại Khu Di tích quốc gia đặc biệt Hải Thượng Lãn Ông Lê Hữu Trác (Hà Tĩnh), Viện Dược liệu (Bộ Y tế) phối hợp Ủy ban nhân dân xã Sơn Giang và Vườn Quốc gia Vũ Quang tổ chức hoạt động 'Chung tay bảo tồn cây thuốc nam'. Đây là hoạt động hưởng ứng Ngày quốc tế Đa dạng sinh học (22/5) và Ngày Môi trường thế giới (5/6).

Cách xem mật khẩu Wi-Fi đã kết nối trên Android hiệu quả

1 giờ

Đôi khi bạn cần chia sẻ Wi-Fi nhưng lại quên mật khẩu đã lưu trên Android. Bạn có thể xem lại pass Wi-Fi dễ dàng trong cài đặt. Dưới đây là cách thực hiện nhanh và đơn giản.

Nvidia lập kỷ lục mới

6 giờ

Sự bùng nổ từ tác nhân AI (AI agent) cùng nhu cầu điện toán trung tâm dữ liệu khổng lồ đã đẩy doanh thu của Nvidia đạt mức kỷ lục 82 tỷ USD.

Tây Ban Nha phát triển thiết bị chuyển đổi sóng biển thành điện tái tạo

3 giờ

Công ty Idom (Tây Ban Nha) phát triển thiết bị cao 42m ứng dụng nguyên lý cột nước dao động để biến chuyển động của sóng biển thành nguồn điện tái tạo.

Tin mới

Phân tích cấu hình và hiệu năng loạt laptop ASUS đang có ưu đãi lớn

6 phút

Đánh giá chi tiết 14 mẫu laptop ASUS từ phân khúc văn phòng mỏng nhẹ đến gaming hiệu năng cao, tích hợp vi xử lý AI và card đồ họa thế hệ mới, đáp ứng đa dạng nhu cầu người dùng.

Hà Nội quyết tâm thúc đẩy IoT trong nông nghiệp

8 phút

Trong bối cảnh chuyển đổi số đang diễn ra mạnh mẽ trên mọi lĩnh vực, Hà Nội đang thể hiện quyết tâm cao trong việc đưa công nghệ Internet vạn vật (IoT) vào nông nghiệp nhằm nâng cao năng suất, chất lượng nông sản và xây dựng nền nông nghiệp hiện đại, bền vững.

Brazil tăng cường quản lý các nền tảng công nghệ lớn

10 phút

Ngày 20/5, Tổng thống Brazil Lula da Silva đã ký 2 sắc lệnh nhằm tăng cường quản lý hoạt động của các nền tảng công nghệ lớn tại Brazil, trong bối cảnh Chính phủ nước này đẩy mạnh cuộc chiến chống tin giả và nội dung bất hợp pháp trên mạng xã hội.

Đẩy mạnh ứng dụng AI để chuyển đổi giao thông tại Đông Nam Á

13 phút

Nhiều quốc gia Đông Nam Á như Singapore, Thái Lan, Indonesia hay Việt Nam đang đẩy mạnh ứng dụng AI để tiến tới hệ thống giao thông thông minh. Tuy nhiên, sự sẵn sàng của hạ tầng, lực lượng lao động và khả năng bảo đảm mọi người dân đều được hưởng lợi từ quá trình chuyển đổi này là ba vấn đề các quốc gia cần cân nhắc kỹ lưỡng...