CEO Nvidia mê mẩn Nano Banana, hé lộ cách dùng ChatGPT, Gemini và Grok

16 giờ trước Gốc

Jensen Huang thể hiện niềm đam mê với Nano Banana của Google và hé lộ dùng ChatGPT, Gemini, Grok, Perplexity để làm gì.

Hôm 17.9, ông Jensen Huang, Giám đốc điều hành Nvidia, có mặt ở London (thủ đô Anh), đứng trước một căn phòng đầy các nhà báo và công khai thừa nhận mình là fan cuồng của Nano Banana.

Nano Banana là mô hình AI tạo và chỉnh sửa ảnh do Google DeepMind phát triển, có tên gọi chính thức là Gemini 2.5 Flash Image.

“Làm sao mà ai lại không thích Nano Banana cơ chứ? Ý tôi là Nano Banana tuyệt vời đến mức nào. Đừng nói với tôi là không phải thế nhé! Nói với tôi là điều đó không đúng đi! Nó quá tốt. Hôm qua, tôi vừa trò chuyện với Demis Hassabis (Giám đốc điều hành Google DeepMind - PV) và nói: Nano Banana thật sự rất đỉnh”, Jensen Huang cho hay.

Rất nhiều người đồng tình với ông. Theo một bài đăng trên mạng xã hội X của Josh Woodward - Phó chủ tịch Google Labs và Google Gemini, việc Nano Banana gây sốt đã làm tăng 300 triệu hình ảnh được tạo bằng Gemini chỉ vài ngày đầu tháng 9.

Ra mắt vào tháng 8, Nano Banana cho phép người dùng chỉnh sửa chính xác ảnh mà vẫn giữ nguyên chất lượng khuôn mặt con người, động vật hoặc các vật thể khác trong nền.

Jensen Huang phát cuồng vì Nano Banana của Google - Ảnh: Getty Images

Nvidia và các hãng công nghệ lớn Mỹ đầu tư vào Anh

Anh và Mỹ đã đồng ý về một thỏa thuận công nghệ nhằm thúc đẩy quan hệ trong lĩnh vực AI, điện toán lượng tử và năng lượng hạt nhân dân sự. Trong đó, các tập đoàn hàng đầu Mỹ, gồm cả Nvidia, Microsoft và Google, cam kết đầu tư 31 tỉ bảng (42 tỉ USD) vào Anh.

Phát biểu trước sự kiện tiệc trang trọng với Thủ tướng Anh Keir Starmer, Jensen Huang lạc quan một cách sôi nổi về tương lai AI ở Anh, cho rằng quốc gia này đang “quá khiêm tốn” về tiềm năng phát triển AI của mình.

Ông dẫn ra bề dày lịch sử của Anh trong các lĩnh vực rộng lớn như Cách mạng Công nghiệp, tàu hỏa hơi nước, DeepMind (nay thuộc Google), các nhà nghiên cứu đại học tài năng cùng nhiều kỹ năng liên quan khác.

Tuần này, Nvidia đã công bố các khoản đầu tư vào trung tâm dữ liệu, siêu máy tính và nghiên cứu AI tại Anh. Đáng chú ý, hãng chip AI số 1 thế giới thông báo rót 683 triệu USD vào Nscale – công ty Anh chuyên xây dựng trung tâm dữ liệu. Động thái này, cùng với các khoản đầu tư từ OpenAI và Microsoft, đã đưa Nvidia trở thành trung tâm của làn sóng thúc đẩy AI tại Anh.

Jensen Huang ước tính Nscale sẽ tạo ra hơn 68 tỉ USD doanh thu trong 6 năm. “Tôi xin nói thẳng là tôi là điều tuyệt vời nhất từng xảy ra với anh ấy”, Jensen Huang nói với giọng hài hước, ám chỉ Giám đốc điều hành Nscale - Josh Payne. Ngụ ý của Jensen Huang là việc Nvidia đầu tư lớn vào Nscale chính là cơ hội lớn nhất, mang lại lợi ích to lớn nhất cho Josh Payne.

Ngoài ra, Nvidia cho biết sẽ triển khai 120.000 bộ xử lý đồ họa (GPU) trên khắp nước Anh. Đây là đợt triển khai lớn nhất của Nvidia tại châu Âu tính đến nay.

Cách dùng AI của Jensen Huang

"Khi các dịch vụ AI được triển khai, tôi chắc rằng tất cả các bạn đều sử dụng nó. Tôi dùng AI mỗi ngày và nó đã cải thiện khả năng học hỏi, suy nghĩ của tôi. AI giúp tôi tiếp cận thông tin, kiến thức hiệu quả hơn nhiều. AI giúp tôi viết, suy nghĩ, hình thành ý tưởng. Vì vậy, trải nghiệm của tôi với AI có lẽ cũng sẽ là trải nghiệm của nhiều người. Tôi có lợi thế là được sử dụng tất cả AI, thật tuyệt vời làm sao?", tỷ phú 62 tuổi người Mỹ gốc Đài Loan chia sẻ với các phóng viên tại Anh.

Trước đó, Giám đốc điều hành Nvidia tiết lộ rằng ông sử dụng các tác tử AI trong cuộc sống cá nhân.

Tác tử AI là hệ thống AI được thiết kế để tự động quan sát, suy luận và thực hiện hành động nhằm đạt mục tiêu đã định. Khác với một ứng dụng AI tĩnh chỉ trả lời khi có lệnh, tác tử AI có khả năng nhận dữ liệu hoặc tín hiệu từ môi trường, phân tích và lên kế hoạch dựa trên kiến thức hoặc thuật toán có sẵn, chủ động thực hiện các bước tiếp theo, thậm chí phối hợp với con người hoặc các tác tử khác để hoàn thành nhiệm vụ.

Ví dụ, một tác tử AI có thể liên tục quét email, tự động soạn và gửi phản hồi phù hợp. Trong phần mềm, tác tử AI có thể tự lập kế hoạch sửa lỗi và tối ưu mã nguồn mà không đợi từng chỉ dẫn cụ thể.

Tại Anh, Jensen Huang chia sẻ chi tiết hơn về cách sử dụng AI (ngoài Nano Banana) cho hầu hết công việc hàng ngày, gồm cả các bài phát biểu trước công chúng và nghiên cứu.

"Tôi thực sự thích dùng một trình xử lý văn bản AI vì nó 'nhớ' tôi và biết tôi sẽ nói về điều gì. Tôi có thể mô tả hoàn cảnh khác nhau mình đang ở và nó vẫn nhận ra tôi là Jensen trong một hoàn cảnh khác. Bằng cách đó, AI có thể điều chỉnh lại những gì tôi đang làm và trở nên hữu ích. AI là đối tác tư duy, thực sự tuyệt vời và tiết kiệm cho tôi rất nhiều thời gian. Thành thật mà nói, tôi nghĩ chất lượng công việc của mình tốt hơn nhờ AI", Jensen Huang giải thích.

Ứng dụng AI yêu thích của Jensen Huang phụ thuộc vào việc ông đang làm gì.

“Với việc thiên về kỹ thuật, tôi sẽ dùng Gemini. Nếu làm thứ gì mang tính nghệ thuật hơn, tôi thích Grok. Nếu cần truy cập thông tin nhanh, tôi chọn Perplexity vì nó làm rất tốt việc trình bày nghiên cứu cho tôi. Còn với các nhu cầu gần như hằng ngày thì tôi thích dùng ChatGPT. Khi làm một việc nghiêm túc, tôi sẽ đưa cùng câu lệnh cho tất cả công cụ AI đó, rồi yêu cầu chúng hãy phê bình lẫn nhau. Sau đó, tôi chọn cái hay nhất”, Giám đốc điều hành Nvidia tiết lộ.

Cuối cùng, Jensen Huang lại quay trở lại chủ đề với Nano Banana. “AI nên được dân chủ hóa cho tất cả mọi người. Không ai nên bị bỏ lại phía sau. Thật vô lý khi có ai đó bị bỏ lại trong cuộc cách mạng điện, internet hay công nghệ cấp độ tiếp theo. AI chính là cơ hội lớn nhất để chúng ta thu hẹp khoảng cách công nghệ. Công nghệ này rất dễ dùng. Ai mà chẳng biết cách dùng Nano Banana chứ?”, ông chia sẻ thêm.

Nano Banana giúp Google Gemini bay xa

Nhờ tính năng Nano Banana, Google Gemini đã vượt qua ChatGPT để trở thành ứng dụng miễn phí phổ biến nhất trên iPhone tại Mỹ và Anh trong tháng 9. Chỉ trong hai tuần, người dùng đã tạo hơn 500 triệu hình ảnh bằng Nano Banana.

Từ khi Nano Banana ra mắt, Gemini đã thu hút thêm hơn 23 triệu người dùng mới. Nhiều hình ảnh do người dùng tạo bằng Nano Banana đã lan truyền mạnh mẽ trên các mạng xã hội.

Nano Banana đang là mô hình AI tạo và chỉnh sửa ảnh đứng đầu nhiều bảng xếp hạng, gồm cả LMArena và Artificial Analysis.

Theo Google, thế mạnh đặc biệt của Nano Banana là giữ nguyên được hình dáng, diện mạo hay đặc điểm nhận dạng một người hoặc động vật qua nhiều ảnh khác nhau. Nói cách khác, khi bạn yêu cầu Nano Banana thực hiện các chỉnh sửa hoặc tạo ra nhiều phiên bản khác nhau của một ảnh (thay đổi trang phục, bối cảnh hoặc thêm phụ kiện), Nano Banana có khả năng duy trì đặc điểm khuôn mặt và hình dáng tổng thể của chủ thể (người hoặc động vật) một cách nhất quán, không làm biến dạng hay thay đổi nhận dạng ban đầu.

Google khẳng định người dùng thích Nano Banana hơn sản phẩm OpenAI và các đối thủ khác, dựa trên điểm Elo - phương pháp tính toán mức độ khéo léo tương đối của các mô hình AI tạo sinh.

Trên bài đăng trên blog của mình, Google tự tin gọi Nano Banana là mô hình chỉnh sửa ảnh được đánh giá cao nhất trên thế giới. Theo một số chuyên gia, Nano Banana là mối đe dọa với nhiều phần mềm chỉnh sửa ảnh hiện có, gồm cả Adobe Photoshop.

Nano Banana là mô hình AI tạo và chỉnh sửa gây sốt nhất hiện nay

9 tính năng nổi bật của Nano Banana

1. Tính nhất quán nhân vật

Duy trì đặc điểm nhận diện của người, vật hoặc đối tượng qua nhiều lần chỉnh sửa khác nhau, giúp ảnh cuối cùng vẫn giữ được bản sắc ban đầu dù đã thay đổi nhiều chi tiết.

2. Chỉnh sửa theo lệnh tự nhiên

Cho phép thay đổi các chi tiết trong ảnh chỉ bằng ngôn ngữ tự nhiên, chẳng hạn thay nền, sửa tư thế, loại bỏ chi tiết không mong muốn, làm mờ hậu cảnh, thay màu ảnh đen trắng... bằng một câu lệnh đơn giản.

3. Hỗ trợ chỉnh sửa đa bước

Cho phép bạn tiếp tục chỉnh sửa ảnh từng bước, ví dụ bắt đầu với một phòng trống, sau đó yêu cầu vẽ tường mới, thêm kệ sách, rồi thay đổi màu sắc... trong khi vẫn giữ bố cục chính.

4. Kỹ thuật kết hợp nhiều ảnh

Hợp nhất nhiều ảnh đầu vào vào cùng cảnh mới chỉ bằng một lệnh. Ví dụ đưa hai ảnh riêng biệt thành một hình chụp chung, phối các đồ vật vào môi trường mới.

5. Hiểu ngữ cảnh và kiến thức thế giới

Khả năng hiểu và xử lý các hướng dẫn phức tạp, chẳng hạn đọc sơ đồ vẽ tay, trả lời câu hỏi thực tế hoặc thực hiện chỉnh sửa theo logic thế giới thật.

6. Áp dụng phong cách từ ảnh này sang ảnh khác

Ví dụ lấy màu, kết cấu hoặc phong cách của một bông hoa và áp dụng lên đôi ủng hoặc trang phục, tạo ra hiệu ứng sáng tạo liền mạch.

7. Tốc độ xử lý nhanh chóng và hiệu quả

Thời gian tạo và chỉnh sửa hình ảnh rất nhanh, chỉ trong vài giây hoặc dưới 30 giây, nhanh hơn nhiều so với các công cụ chỉnh sửa truyền thống.

8. Đánh dấu bản quyền tự động

Mỗi hình ảnh được chỉnh sửa hoặc tạo ra sẽ mang cả dấu hiệu AI dễ nhìn thấy, lẫn dấu watermark kỹ thuật số ẩn (SynthID) để xác lập nguồn gốc và hạn chế lạm dụng.

9. Triển khai rộng rãi trên nền tảng Google

Nano Banana đã được tích hợp trong ứng dụng Gemini, đồng thời khả dụng qua Gemini API, Google AI Studio và Vertex AI cho cả người dùng cá nhân lẫn doanh nghiệp.

Gemini API là giao diện lập trình ứng dụng (API) để truy cập trực tiếp các mô hình Gemini của Google, gồm cả Nano Banana.

Google AI Studio là môi trường làm việc trực tuyến của Google, dành cho những ai muốn thử nghiệm và xây dựng ứng dụng AI nhanh chóng mà không cần viết nhiều mã.

Vertex AI là nền tảng AI doanh nghiệp trên dịch vụ đám mây Google Cloud.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/ceo-nvidia-me-man-nano-banana-he-lo-cach-dung-chatgpt-gemini-va-grok-237659.html