Với Gemini 3, Google phô trương lợi thế lớn nhất trước OpenAI

7 giờ trước Gốc

Google cho biết Gemini 3 giỏi hơn về khả năng lập trình và sáng tạo, nhưng đó không phải là thứ khiến OpenAI và các đối thủ lo lắng nhất.

Các lãnh đạo Google nói gì về Gemini 3?

Google vừa công bố Gemini 3, mô hình AI mới nhất của mình. Sundar Pichai, Giám đốc điều hành Google, mô tả Gemini 3 là "mô hình thông minh nhất của chúng tôi".

"Kể từ khi kỷ nguyên Gemini bắt đầu, chúng tôi đã không ngừng nỗ lực để xây dựng AI tổng quát và hữu ích hơn cho mọi người. Với Gemini 1, chúng tôi đã giới thiệu tính đa phương thức và ngữ cảnh dài để giúp AI hiểu thế giới của chúng ta. Gemini 2 đã bổ sung tư duy, suy luận và sử dụng công cụ gốc để tạo nền tảng cho các tác tử AI. Giờ đây, chúng tôi xin giới thiệu Gemini 3, mô hình thông minh nhất của chúng tôi, kết hợp tất cả các khả năng của Gemini lại với nhau để bạn có thể hiện thực hóa bất kỳ ý tưởng nào", Google cho biết trong bài đăng trên blog.

Theo Sundar Pichai, Gemini 3 sẽ giúp người dùng nhận được phản hồi tốt hơn cho những câu hỏi phức tạp hơn, “giúp bạn có được điều mình cần với ít gợi ý hơn”.

Các lãnh đạo Google tự hào tuyên bố Gemini 3 dẫn đầu trên một số bảng xếp hạng phổ biến đo lường hiệu suất mô hình AI.

Các thông báo trên được đưa ra khoảng 8 tháng sau khi Google giới thiệu Gemini 2.5 và 11 tháng sau Gemini 2.0 trình làng.

Khởi xướng cơn sốt AI tạo sinh khi ra mắt ChatGPT hồi tháng 11.2022, OpenAI đã giới thiệu mô hình GPT-5 vào tháng 8 và phiên bản mới GPT-5.1 hôm 13.11 vừa qua. Cụ thể hơn, OpenAI thông báo nâng cấp GPT-5 bằng hai phiên bản: GPT-5.1 Instant (phản hồi thân thiện và tự nhiên hơn, thông minh hơn và làm theo hướng dẫn của bạn tốt hơn) và GPT-5.1 Thinking (dễ hiểu hơn và nhanh hơn với các tác vụ đơn giản, kiên trì hơn với các tác vụ phức tạp).

Google tuyên bố Gemini 3 dẫn đầu trên một số bảng xếp hạng phổ biến đo lường hiệu suất mô hình AI - Ảnh: Internet

Theo Google, Gemini 3 sẽ được tích hợp vào ứng dụng Gemini, sản phẩm tìm kiếm AI của Google như AI Mode và AI Overviews, cũng như các sản phẩm doanh nghiệp. Việc triển khai bắt đầu từ 19.11 cho một số người đăng ký chọn lọc và sẽ mở rộng hơn trong vài tuần tới.

Lần đầu tiên Google sẽ tích hợp ngay lập tức mô hình AI mới ra mắt vào công cụ tìm kiếm. Điều này đồng nghĩa người dùng có thể truy cập Gemini 3 trong Google Search bằng cách nhấp vào AI Mode (Chế độ AI) mà không cần tải ứng dụng hay vào trang web riêng.

Ứng dụng Gemini hiện có 650 triệu người dùng hoạt động hàng tháng và AI Overviews có 2 tỉ người dùng hàng tháng, theo Google. Trong khi OpenAI cho biết ChatGPT hiện có 800 triệu người dùng hàng tuần.

Sundar Pichai cho biết Gemini 3 được “xây dựng để nắm bắt chiều sâu và sắc thái, giỏi hơn nhiều trong việc nhận biết ngữ cảnh và mục đích đằng sau yêu cầu của người dùng, giúp bạn có được điều mình cần với ít gợi ý hơn”.

"Các câu trả lời do Gemini 3 cung cấp sẽbỏ qua những lời sáo rỗng và tâng bốc, thay vào đó cung cấp thông tin thực sự hữu ích, nói với bạn điều cần biết, chứ không phải điều bạn muốn nghe”, theo Demis Hassabis - Giám đốc điều hành Google DeepMind. Các nhà phê bình trong ngành cho rằng chatbot AI hiện nay thường quá xu nịnh.

Josh Woodward, Phó chủ tịch Google Labs và Gemini, cho biết Gemini 3 là “mô hình vibe coding tốt nhất từ trước đến nay” trong buổi họp báo.

Vibe coding là khái niệm mới trong cộng đồng AI, mô tả cách viết mã kết hợp với AI một cách linh hoạt, thay vì thực hiện thủ công. Nói cách khác, thay vì ngồi suy nghĩ rồi gõ từng dòng mã, bạn sẽ trao đổi với AI để thử nhiều hướng tiếp cận khác nhau, tinh chỉnh và xây dựng dự án theo kiểu “đi theo cảm hứng”, giống làm việc song hành cùng cộng tác viên thông minh.

Google cho biết Gemini 3 sẽ hỗ trợ “giao diện tạo sinh”, cung cấp câu trả lời theo cách giống như một tạp chí kỹ thuật số. Ví dụ, khi Google yêu cầu Gemini 3 “mô tả Bảo tàng Van Gogh với bối cảnh sống cho mỗi tác phẩm” thì nhận được phần giải thích sinh động, có hình ảnh cho từng bức tranh.

Trong Chế độ AI, Gemini 3 trước tiên sẽ có sẵn cho người dùng trả phí. Mô hình Ai mới của Google có thể phân tích câu hỏi và tạo bố cục với các yếu tố trực quan như hình ảnh, bảng biểu và lưới. Google tiết lộ Gemini 3 có thể mô phỏng tương tác về một vấn đề vật lý phức tạp.

Với khách hàng doanh nghiệp, Gemini 3 có thể thực hiện các công việc như tạo chương trình onboarding và đào tạo nhân viên, phân tích video và hình ảnh sàn nhà máy chính xác hơn, cũng như xử lý mua sắm, theo Google.

Chương trình onboarding là quá trình giới thiệu và đào tạo nhân viên mới gia nhập một công ty, giúp họ nhanh chóng làm quen với môi trường làm việc, văn hóa doanh nghiệp, quy trình công việc, công cụ và nhiệm vụ cụ thể.

Video Google giới thiệu Gemini 3

Google sở hữu lợi thế toàn diện về công nghệ, nhưng OpenAI có lợi thế thương hiệu

Dù sở hữu ChatGPT - chatbot AI phổ biến nhất trên thế giới, OpenAI lại phụ thuộc vào các đối tác về chip và trung tâm dữ liệu. Ngược lại, Google sở hữu tất cả và có thể kiểm soát hoàn toàn sản phẩm AI của mình, từ nghiên cứu giai đoạn đầu đến hệ thống đám mây nội bộ tự vận hành, cũng như các đề xuất trên YouTube và tóm tắt tìm kiếm do AI tạo ra mà người dùng nhận được.

Tuy nhiên, OpenAI vẫn có một lợi thế lớn trước Google. Đó là về thương hiệu - lĩnh vực mà Google từng được hưởng lợi trong nhiều năm thông qua công cụ tìm kiếm và trình duyệt web Chrome.

Nhờ sở hữu tiềm lực tài chính và toàn bộ chuỗi công nghệ từ đầu đến cuối, Google không cần dựa vào các công ty khác như OpenAI và cũng không phải tham gia vào những vòng huy động vốn phức tạp.

Phát biểu trước khi Gemini 3 ra mắt, Koray Kavukcuoglu (Giám đốc công nghệ của Google DeepMind) nhấn mạnh khả năng kiểm soát toàn bộ quá trình là lý do giúp họ tiến nhanh hơn.

Hiện tại, kênh AI của Google được vận hành như sau:

1. Các nhà nghiên cứu Google DeepMind tạo ra mô hình AI.

2. Google dùng TPU (Tensor Processing Unit) nội bộ để huấn luyện các mô hình đó. TPU là loại chip xử lý chuyên dụng do Google phát triển để tăng tốc các tác vụ học máy, đặc biệt là cho mạng nơ-ron và AI.

3. Google sử dụng dịch vụ đám mây của chính mình để lưu trữ và cung cấp mô hình AI cho các nhà phát triển.

4. Google tích hợp các mô hình AI này vào Search, YouTube, Gemini và các ứng dụng phổ biến khác, đưa chúng trực tiếp vào tay người dùng.

Thách thức lớn nhất của Google từ cuối năm 2022 là làm tất cả những điều này hoạt động hài hòa, điều không hề dễ dàng với công ty có gần 200.000 nhân viên và mảng quảng cáo tìm kiếm mà họ đã cẩn trọng bảo vệ nhiều thập kỷ. Sự đồng bộ này đòi hỏi thay đổi cơ cấu, đầu tư lớn hơn vào mảng đám mây và nỗ lực nội bộ để trở nên tinh gọn, hoạt động nhanh hơn. Đến nay, dường như những nỗ lực đó của Google đang bắt đầu phát huy hiệu quả.

Tuy nhiên ngay cả khi hoạt động hết công suất, Google vẫn gặp vấn đề về thương hiệu. “ChatGPT” đã đồng nghĩa với AI trong suy nghĩ của nhiều người, giống như cách “Google” trở thành từ viết tắt cho việc tìm kiếm trên internet.

May mắn cho Google là họ còn nhiều thời gian để thay đổi điều đó. Trong khi OpenAI có lợi thế đi trước, Google lại sở hữu tiềm lực tài chính. Google đã cung cấp miễn phí một số mô hình AI của mình và nếu muốn hạ giá để được nhiều người dùng tiếp cận hơn, họ hoàn toàn có thể làm thế.

“Không có gì phải tranh cãi rằng Google sở hữu tất cả yếu tố kỹ thuật vô hình trên toàn bộ nền tảng (hạ tầng, mô hình, ứng dụng) và các kênh thị trường để giành chiến thắng, nhưng chúng ta cần bằng chứng rõ rằng họ đang kết hợp tất cả lại với nhau”, nhà phân tích Mark Schmulik của công ty nghiên cứu Bernstein viết trong một ghi chú.

Với Gemini 3, có thể chúng ta vừa thấy được một phần bằng chứng đó.

Ngay sau khi Gemini 3 trình làng, Sam Altman (Giám đốc điều hành OpenAI) viết trên mạng xã hội X: "Xin chúc mừng Google với Gemini 3! Có vẻ như đây là một mô hình rất ấn tượng".

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/voi-gemini-3-google-pho-truong-loi-the-lon-nhat-truoc-openai-241239.html