Nano Banana Pro của Google giúp tạo ảnh AI với chữ tiếng Việt chính xác hơn
Nano Banana Pro, mô hình AI tạo ảnh mới nhất của Google, hiển thị văn bản trên ảnh chính xác hơn rất nhiều so với phiên bản trước.
Hôm 20.11, Google ra mắt Nano Banana Pro, mô hình AI (trí tuệ nhân tạo) tạo ảnh mới nhất của công ty. Nhiều cải tiến trong Nano Banana Pro hướng đến doanh nghiệp, từ việc tích hợp Nano Banana Pro vào Google Slides cho các bài thuyết trình kinh doanh đến kết nối mô hình này với Google Ads cho các nhà quảng cáo toàn cầu.
Đây là bản nâng cấp của Nano Banana, ra mắt hồi tháng 8, từng gây sốt trên mạng xã hội sau khi người dùng đăng tải hàng loạt mô hình nhân vật hành động cá nhân hóa và sản phẩm meme khác.
Nano Banana Pro được bổ sung hàng loạt khả năng mới, chẳng hạn tạo hình ảnh ở độ phân giải 4K. Những cải tiến đáng chú ý trên Nano Banana Pro như sau:
- Tạo văn bản rõ ràng hơn bên trong hình ảnh.
- Chuyển đổi phong cách ảnh một cách mượt mà.
- Kết hợp 6 hình ảnh cùng một lúc với kết quả chất lượng cao.
- Biến ý tưởng thành hình ảnh chất lượng chuyên nghiệp.

Bảng thông báo cho biết những cải tiến của Nano Banana Pro - Ảnh chụp màn hình
Người dùng có thể dùng thử Nano Banana Pro miễn phí trong Gemini của Google.
Điểm khác biệt của người dùng Gemini miễn phí và trả phí với Nano Banana Pro:

Thử nghiệm tạo ảnh có chữ tiếng Việt với Nano Banana Pro
Một cải tiến ở Nano Banana Pro chắc chắn sẽ thu hút các doanh nghiệp là khả năng hiển thị văn bản trên ảnh.
Theo các thử nghiệm của PV Một Thế Giới khi tạo hình ảnh, Nano Banana Pro cải thiện đáng kể việc hiển thị chính xác chữ, gồm cả tiếng Việt, vốn thường bị lệch hoặc sai chính tả ở nhiều mô hình AI tạo ảnh, gồm cả phiên bản trước của Gemini.


Thử nghiệm tạo ảnh cô gái mặc áo dài với chữ tiếng Việt của PV Một Thế Giới
Google muốn hình ảnh được tạo ra bởi Nano Banana Pro, gồm cả văn bản, được trau chuốt hơn và sẵn sàng cho việc sản xuất, phục vụ cho các trường hợp sử dụng trong kinh doanh.
Nicole Brichtova, trưởng nhóm sản phẩm hình ảnh và video tại Google DeepMind, cho biết: “Ngay cả khi chỉ thiếu một chữ cái thôi cũng rất dễ nhận ra, giống như bàn tay sáu ngón. Đó là điều bạn nhìn thấy đầu tiên”. Bà giải thích một phần lý do Nano Banana Pro có thể tạo văn bản chính xác hơn là nhờ chuyển sang mô hình nền tảng mạnh mẽ hơn, Gemini 3 Pro.
Reece Rogers, biên tập viên tạp chí Wired, cho biết: “Tờ rơi và banner quảng cáo web giả mà tôi tạo ra đôi khi có sắc vàng đặc trưng của đồ họa AI. Tuy nhiên, Nano Banana Pro vẫn có thể tạo ra các tài liệu tiếp thị khá chi tiết, với các câu đầy đủ trên nhiều kiểu font, chỉ với một câu lệnh duy nhất. Người dùng có thể yêu cầu chỉnh sửa hình ảnh trong câu lệnh tiếp theo, chẳng hạn xóa một chi tiết cụ thể hoặc điều chỉnh phong cách tổng thể”.
Nicole Brichtova cho biết khả năng hiển thị văn bản cải thiện này giúp việc tạo infographic trở nên dễ dàng hơn đáng kể với Nano Banana Pro. Một số thử nghiệm ban đầu của Reece Rogers chứng minh điều này. Ví dụ, infographic tiếng Anh mà Nano Banana Pro tạo về cách chiên gà tây đã cung cấp hướng dẫn hợp lý và trích dẫn cảnh báo từ Cơ quan Quản lý Lực lượng Cứu hỏa Mỹ, cùng các biện pháp an toàn phù hợp khác. Song theo thử nghiệm của PV Một Thế Giới, việc infographic tiếng Việt với Nano Banana Pro vẫn bị lỗi chính tả rất nhiều, như phiên bản trước.
“Nano Banana Pro hiện sử dụng kiến thức và khả năng suy luận của Gemini để tạo ra không chỉ hình ảnh đẹp mắt mà còn hình ảnh giàu thông tin. Bạn có thể tạo infographic về loài động vật yêu thích của mình, hoặc tạo hình ảnh để đưa vào bài thuyết trình công việc”, Nicole Brichtova nói.
Với Nano Banana Pro, nhân viên văn phòng có thể thấy hình ảnh AI tại nơi làm việc, từ slide thuyết trình đến tài liệu quảng cáo, nhiều hơn trước đây.
Một khía cạnh nổi bật khác của Nano Banana Pro là hỗ trợ tạo văn bản bằng nhiều ngôn ngữ. “Đây là lần đầu tiên tôi thấy mô hình của chúng tôi có thể hiển thị tiếng Cộng hòa Séc với đầy đủ dấu và ký tự”, Nicole Brichtova cho hay.
Các công ty có thể yêu cầu chuyển đổi hình ảnh thương hiệu sang ngôn ngữ khác cho mục đích bản địa hóa. Trong ví dụ trên blog, Google cho biết Nano Banana Pro thay đổi chữ trên lon nước tăng lực từ tiếng Anh sang tiếng Hàn mà vẫn giữ nguyên các yếu tố thiết kế khác.

Nano Banana Pro thay đổi chữ trên lon nước tăng lực từ tiếng Anh sang tiếng Hàn
Vì kết nối với Google Search, Nano Banana Pro có thể lấy thông tin từ web và tích hợp vào đồ họa. Song để có kết quả tốt nhất, bạn phải đưa ra hướng dẫn cụ thể.
Gặp khó khăn khi gắn nhãn hình ảnh
Nano Banana Pro vẫn còn gặp khó khăn trong bài kiểm tra của Reece Rogers ở khâu gắn nhãn hình ảnh. Khi được yêu cầu tạo hình ảnh bữa tiệc Lễ Tạ ơn được bày trên bàn và sau đó gắn nhãn mọi thứ trong hình ảnh, kết quả Nano Banana Pro tạo ra là có một mũi tên chỉ vào chiếc thìa được gắn nhãn là "Lá mùa thu"; một chỗ trống trên bàn lại được gắn nhãn là “bánh mì bữa tối” dù bàn hoàn toàn không có bánh mì.
Dù còn một số hạn chế, Nano Banana Pro có khả năng gây sốt như phiên bản trước, khi các công ty đang tìm cách tạo ra hình ảnh độ phân giải cao và tài liệu tiếp thị nhanh hơn, rẻ hơn. Thời kỳ hình ảnh AI do doanh nghiệp tạo ra cho cả mục đích nội bộ lẫn bên ngoài đang phát triển mạnh.













