Mô hình chỉnh sửa ảnh AI mới của Google khiến Photoshop phải dè chừng

Hôm nay là ngày không tốt với Adobe - công ty phát triển Photoshop. Lý do vì Google chính thức ra mắt mô hình chỉnh sửa ảnh Nano Banana từng gây bão trên mạng xã hội.

Từng nhận được nhiều lời khen ngợi qua bản xem trước, Nano Banana giờ đã có mặt để người dùng Google Gemini trải nghiệm.

Google vừa thông báo rằng DeepMind đã tạo ra Nano Banana và đang tích hợp nó vào ứng dụng cũng như trang web Gemini để bất kỳ ai cũng có thể sử dụng. Theo Google, Nano Banana còn có tên gọi là Gemini 2.5 Flash Image.

Google từng thử nghiệm Nano Banana trên LMArena - trang web công khai thu thập phản hồi ẩn danh từ cộng đồng về chất lượng các mô hình AI. Điều đáng nói là một số người dùng nhanh chóng đoán ra rằng Google đứng sau Nano Banana trước khi gã khổng lồ công nghệ Mỹ xác nhận thông tin này.

Google cho biết thế mạnh đặc biệt của Nano Banana là giữ nguyên được hình dáng, diện mạo hay đặc điểm nhận dạng của một người hoặc động vật qua nhiều bức ảnh khác nhau. Nói cách khác, khi bạn yêu cầu Nano Banana thực hiện các chỉnh sửa hoặc tạo ra nhiều phiên bản khác nhau của một ảnh (thay đổi trang phục, bối cảnh hoặc thêm phụ kiện), mô hình AI này có khả năng duy trì đặc điểm khuôn mặt và hình dáng tổng thể của chủ thể (người hoặc động vật) một cách nhất quán, không làm biến dạng hay thay đổi nhận dạng ban đầu.

Theo những phản hồi đến nay, Google khẳng định người dùng thích Nano Banana hơn sản phẩm OpenAI và các đối thủ khác, dựa trên điểm Elo - phương pháp tính toán mức độ khéo léo tương đối của các mô hình AI tạo sinh.

Google vừa giới thiệu mô hình chỉnh sửa ảnh Nano Banana

Google vừa giới thiệu mô hình chỉnh sửa ảnh Nano Banana

Trang Insider đã thử nghiệm Nano Banana trong vài ngày và nhận thấy mô hình chỉnh sửa ảnh của Google nhìn chung tốt hơn các công cụ khác. Dù không hoàn hảo, đôi khi gặp khó khi ghép hai khuôn mặt khác nhau, Nano Banana đặc biệt mạnh trong việc thực hiện các chỉnh sửa nhỏ cho ảnh hiện có.

Trong ví dụ dưới đây, trang Insider yêu cầu Nano Banana thêm kính cho người đàn ông này và đổi màu áo phông sang màu đỏ. Dù nhiều mô hình AI khác làm đúng cả kính lẫn màu sắc, chỉ Nano Banana giữ nguyên được hoa văn sọc trên áo và tạo ra một trong những kết quả sắc nét nhất.

Ảnh phóng viên Hugh Langley của Insider được chỉnh sửa bởi Nano Banana

Ảnh phóng viên Hugh Langley của Insider được chỉnh sửa bởi Nano Banana

Nano Banana có thể là mối đe dọa với các công cụ chỉnh sửa ảnh hiện có, đặc biệt là Photoshop của Adobe.

Theo trang Insider, Google xem Nano Banana như một công cụ cho cả người dùng phổ thông và chuyên nghiệp. Nano Banana sẽ được cung cấp cho cả người dùng trả phí lẫn miễn phí của Google Gemini.

Hôm 26.8, Adobe cũng cho biết sẽ ngay lập tức tích hợp Nano Banana vào Adobe Firefly và Adobe Express.

Khi được hỏi vì sao người dùng nên chọn Adobe Firefly và Adobe Express thay vì đến trực tiếp với Google, Adobe trả lời Insider rằng lợi thế của họ là cung cấp tất cả mô hình trong một nền tảng duy nhất. Điều này giúp người dùng không phải chuyển qua lại giữa nhiều công cụ khác nhau.

Một người phát ngôn nói thêm rằng Adobe cho phép nhà sáng tạo chuyển sản phẩm của họ qua lại giữa các ứng dụng thuộc công ty này.

Tuy nhiên, điều đó vẫn chưa xoa dịu được lo ngại của giới đầu tư. Cổ phiếu Adobe đã giảm 35% trong năm qua, một phần do các nhà phân tích lo sợ tác động của AI đến những công cụ truyền thống này.

“Mô hình chỉnh sửa ảnh được đánh giá cao nhất trên thế giới

Trên bài đăng trên blog của mình, Google giới thiệu chi tiết về Nano Banana và tự tin gọi đây là mô hình chỉnh sửa ảnh được đánh giá cao nhất trên thế giới. Bài viết có nội dung như sau: “Hôm nay, chúng tôi ra mắt mô hình chỉnh sửa hình ảnh mới từ Google DeepMind ngay trong ứng dụng Gemini. Nhiều người đã vô cùng thích thú mô hình này trong các bản xem trước sớm. Đó là mô hình chỉnh sửa hình ảnh được đánh giá cao nhất trên thế giới. Giờ đây, chúng tôi rất vui được tích hợp nó vào ứng dụng Gemini để bạn có quyền kiểm soát tốt hơn bao giờ hết trong việc tạo ra ảnh hoàn hảo.

Duy trì diện mạo khi bạn chỉnh sửa

Chúng tôi đã ra mắt tính năng chỉnh sửa hình ảnh gốc trong ứng dụng Gemini vào đầu năm nay và nỗ lực cải thiện nó, đặc biệt tập trung vào việc duy trì sự giống nhau của một nhân vật từ ảnh này sang ảnh khác. Chúng tôi hiểu rằng khi chỉnh sửa ảnh của chính bạn hoặc những người bạn quen biết, những chi tiết nhỏ cũng rất quan trọng. Một hình ảnh 'gần giống nhưng không hoàn toàn' sẽ không tạo cảm giác chân thật. Đó là lý do tại sao bản cập nhật mới nhất của chúng tôi được thiết kế để giữ cho ảnh bạn bè, gia đình và thậm chí cả thú cưng luôn giống nguyên gốc, dù bạn đang thử kiểu tóc búi tổ ong thập niên 60 hay mặc váy xòe cho chó Chihuahua của mình.

Bạn chỉ cần đưa cho Gemini một bức ảnh và chỉ ra muốn thay đổi điều gì để tạo dấu ấn độc đáo của riêng mình. Gemini cho phép bạn kết hợp các ảnh để đưa bản thân cùng thú cưng vào một khung hình, thay đổi phông nền căn phòng để thử giấy dán tường mới hoặc đưa bạn đến bất kỳ đâu trên thế giới. Khi hoàn thành, bạn thậm chí có thể tải lại ảnh đã chỉnh sửa lên Gemini để biến nó thành video vui nhộn.

Biến tầm nhìn của bạn thành hiện thực với tính năng chỉnh sửa nâng cao

Vài gợi ý để bạn khám phá khả năng chỉnh sửa hình ảnh mới này:

- Thay đổi trang phục hoặc địa điểm: Tải lên ảnh về người hoặc thú cưng và mô hình của chúng tôi sẽ giữ nguyên diện mạo trong mỗi ảnh, khi bạn đặt họ vào các bối cảnh mới. Hãy thử thay đổi trang phục hoặc công việc cho bản thân, thậm chí xem bạn sẽ trông như thế nào trong một thập kỷ khác khi vẫn giữ nguyên dáng vẻ của chính bạn.

- Trộn các ảnh với nhau: Giờ đây, bạn có thể tải lên nhiều ảnh và kết hợp chúng lại với nhau để tạo ra khung cảnh hoàn toàn mới. Ví dụ, hãy lấy ảnh bạn và hình khác về chú chó để tạo ra bức chân dung hoàn hảo của cả hai trên sân bóng rổ.

- Chỉnh sửa đa bước: Bạn có thể tiếp tục chỉnh sửa những hình ảnh mà Gemini tạo ra, chẳng hạn lấy một căn phòng trống, sơn tường, sau đó thêm một giá sách, vài món đồ nội thất hoặc chiếc bàn cà phê. Gemini sẽ đồng hành cùng bạn suốt quá trình đó, thay đổi từng chi tiết mà vẫn giữ nguyên phần còn lại của bức ảnh.

- Kết hợp thiết kế: Áp dụng phong cách của ảnh cho một đối tượng trong hình khác. Bạn có thể lấy màu sắc và kết cấu của cánh hoa để áp dụng cho đôi ủng đi mưa, hoặc thiết kế chiếc váy với hoa văn từ đôi cánh bướm.

Cả người dùng có phí và miễn phí trên toàn cầu đều có thể dùng thử tính năng chỉnh sửa hình ảnh được cập nhật này trong ứng dụng Gemini bắt đầu từ hôm nay. Tất cả hình ảnh được tạo hoặc chỉnh sửa trong ứng dụng Gemini đều có một hình mờ (watermark) dễ thấy, cũng như hình mờ kỹ thuật số vô hình SynthID, để cho thấy rằng chúng được tạo ra bởi AI.

Trong bài đăng khác trên blog dành cho nhà phát triển, Google thông báo: “Vui mừng giới thiệu Gemini 2.5 Flash Image (hay còn gọi là nano-banana), mô hình tạo và chỉnh sửa hình ảnh tiên tiến nhất của chúng tôi. Bản cập nhật này cho phép bạn kết hợp nhiều hình ảnh thành một, duy trì tính nhất quán của nhân vật để kể chuyện sống động, thực hiện các chuyển đổi có mục tiêu bằng ngôn ngữ tự nhiên và sử dụng kiến thức thế giới của Gemini để tạo và chỉnh sửa hình ảnh.

Khi chúng tôi lần đầu ra mắt tính năng tạo ảnh gốc trong Gemini 2.0 Flash đầu năm nay, nhiều người chia sẻ rằng yêu thích độ trễ thấp, hiệu quả về chi phí và tính dễ sử dụng của nó. Tuy nhiên, họ cũng phản hồi rằng cần hình ảnh chất lượng cao hơn và khả năng kiểm soát sáng tạo mạnh mẽ hơn.

Gemini 2.5 Flash Image hiện có sẵn thông qua Gemini API và Google AI Studio dành cho nhà phát triển, Vertex AI dành cho doanh nghiệp. Gemini 2.5 Flash Image có mức giá 30 USD cho mỗi 1 triệu token đầu ra, với mỗi ảnh tương đương 1.290 token đầu ra (hay 0,039 USD cho mỗi ảnh). Tất cả hình thức đầu vào và đầu ra khác đều áp dụng mức giá của Gemini 2.5 Flash”.

Trong bối cảnh AI, token là đơn vị cơ bản nhất mà các mô hình AI như Gemini 2.5 Flash Image sử dụng để xử lý và hiểu dữ liệu. Thay vì xử lý toàn bộ câu hay văn bản cùng lúc, mô hình AI sẽ chia nhỏ chúng thành các token. Token có thể là một từ, một phần của từ, một ký tự hoặc thậm chí là dấu câu.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/mo-hinh-chinh-sua-anh-ai-moi-cua-google-khien-photoshop-phai-de-chung-236759.html