Gemini 2.5 Flash Image: Công cụ AI chỉnh ảnh đỉnh cao

Gemini 2.5 Flash Image hiện được người dùng đánh giá cao và đứng đầu bảng xếp hạng trình chỉnh sửa hình ảnh trên LMArena.

Mô hình Gemini 2.5 Flash Image, hay còn gọi là nano banana đã có mặt trên ứng dụng Gemini, đồng thời cung cấp cho các nhà phát triển qua Gemini API, Google AI Studio và nền tảng Vertex AI. Điểm nổi bật của nó là giải quyết hiệu quả vấn đề lớn trong tạo hình ảnh AI: sự nhất quán khi thực hiện các chỉnh sửa.

Thường khi bạn có một bức ảnh yêu thích nhưng muốn chỉnh sửa một vài chi tiết nhỏ, AI thường làm thay đổi toàn bộ hình ảnh mang tới cảm giác khó chịu. Google cho biết người dùng giờ đây có thể tải ảnh một người rồi thử thay đổi trang phục, kiểu tóc hoặc đặt họ vào các bối cảnh thuộc nhiều thập kỷ khác nhau mà không làm biến dạng chủ thể.

Gemini 2.5 Flash Image hỗ trợ chỉnh sửa chi tiết ảnh mà không làm thay đổi chủ thể - Ảnh: techspot.com

Gemini 2.5 Flash Image hỗ trợ chỉnh sửa chi tiết ảnh mà không làm thay đổi chủ thể - Ảnh: techspot.com

“Giờ đây, bạn có thể đặt cùng một nhân vật vào nhiều môi trường khác nhau, thể hiện một sản phẩm dưới nhiều góc độ trong các bối cảnh mới hoặc tạo ra các tài sản thương hiệu thống nhất, đồng thời vẫn giữ nguyên nét đặc trưng của chủ thể,” Google chia sẻ.

Không chỉ vậy, người dùng còn có thể tải ảnh một người và một con vật cưng, rồi gộp chúng vào một khung cảnh mới. Tính năng chỉnh sửa theo nhiều lượt cho phép thay đổi liên tục hình ảnh theo ý muốn. Google gợi ý người dùng có thể thử thêm nội thất, trang trí vào ảnh phòng để tìm cảm hứng.

Tính năng ghép các chủ thể thành ảnh mới của Gemini gây ấn tượng - Ảnh: techspot.com

Tính năng ghép các chủ thể thành ảnh mới của Gemini gây ấn tượng - Ảnh: techspot.com

Điểm thú vị khác là khả năng pha trộn phong cách thiết kế, giúp áp dụng kiểu dáng của một bức ảnh lên vật thể trong ảnh khác, ví dụ biến họa tiết của cánh bướm thành mẫu thiết kế trên chiếc váy.

Khi các công cụ tạo hình ảnh AI ngày càng tinh vi và khó phân biệt với ảnh thật, cũng xuất hiện nhiều lo ngại về việc sử dụng sai mục đích. Tuy nhiên, Gemini 2.5 Flash Image vẫn duy trì watermark AI ở góc ảnh, cùng watermark kỹ thuật số SynthID vô hình, giúp phát hiện nguồn gốc ngay cả khi ảnh đã bị chỉnh sửa.

Tạo hình ảnh đang trở thành một lĩnh vực cạnh tranh nóng giữa các ứng dụng AI sáng tạo. Elon Musk từng nhấn mạnh khả năng của Grok trong lĩnh vực này. Trong khi nhiều AI khác có các giới hạn để ngăn tạo hình ảnh không phù hợp, Grok còn có chế độ “Spicy” đặc biệt cho phép tạo nội dung nhạy cảm. Khả năng tạo hình ảnh của ChatGPT giúp lượng người dùng của nó gần đạt một tỉ người vào tháng 4 vừa qua, chủ yếu là nhờ loạt ảnh theo phong cách Studio Ghibli. Trong khi đó, Meta cũng thông báo việc cấp phép các mô hình hình ảnh AI của mình cho Midjourney.

Lê Hà

Nguồn Một Thế Giới: https://1thegioi.vn/gemini-2-5-flash-image-cong-cu-ai-chinh-anh-dinh-cao-236781.html