Alibaba tiết lộ bí quyết giảm 88% chi phí đào tạo AI tìm kiếm, không còn phải chi nhiều tiền cho Google
Gã khổng lồ công nghệ Alibaba (Trung Quốc) vừa giới thiệu ZeroSearch, phương pháp mới đào tạo mô hình trí tuệ nhân tạo (AI) không cần liên tục kết nối với các công cụ tìm kiếm bên ngoài.
Alibaba đã công bố bước đột phá trong việc giảm chi phí đào tạo các mô hình AI phục vụ tìm kiếm tới gần 90%. Động thái này diễn ra trong bối cảnh các công ty đang nỗ lực nâng cao năng lực AI, đồng thời giảm thiểu chi phí phát triển.
Cụ thể hơn, các nhà nghiên cứu tại Alibaba giới thiệu phương pháp mới có tên ZeroSearch, giúp cải thiện khả năng tìm kiếm của mô hình AI thông qua mô phỏng, mà không cần tương tác trực tiếp với công cụ tìm kiếm thực tế.
Phương pháp này loại bỏ chi phí cao thường phát sinh khi chuyển truy vấn thông qua các công cụ tìm kiếm thương mại. Thay vào đó, ZeroSearch cho phép các mô hình AI, vốn được đào tạo trên các cơ sở dữ liệu tri thức rộng lớn, tự tạo nội dung chất lượng để phản hồi truy vấn.
Bằng cách biến một mô hình tham chiếu thành công cụ tìm kiếm có thể đào tạo các hệ thống AI khác trong việc trả lời câu hỏi, ZeroSearch giúp giảm sự phụ thuộc vào cơ sở hạ tầng tìm kiếm bên ngoài đắt đỏ. Từ đó, phương pháp này làm cho việc đào tạo AI trong lĩnh vực tìm kiếm trở nên dễ tiếp cận hơn, đặc biệt là với các nhóm nhỏ có nguồn lực hạn chế.
Mô hình tham chiếu đã được huấn luyện trước và có khả năng hoạt động tốt, đóng vai trò làm chuẩn hoặc nguồn dữ liệu để đào tạo mô hình AI khác.
Ví dụ, việc gửi truy vấn tới Google 64.000 lần thông qua giao diện lập trình ứng dụng (API) sẽ tốn khoảng 586,70 USD, trong khi sử dụng một mô hình AI với 14 tỉ tham số để tạo phản hồi phục vụ huấn luyện chỉ tiêu tốn khoảng 70,80 USD, tương đương mức giảm chi phí lên tới 88%.
Google tính phí cho mỗi truy vấn gửi qua API. Trong ví dụ này, nếu hệ thống gửi 64.000 câu hỏi, tổng chi phí phải trả cho Google sẽ là 586,70 USD.
Đổi mới nêu trên có thể thúc đẩy khả năng tìm kiếm của AI, một yếu tố mà các nhà nghiên cứu cho rằng rất quan trọng để nâng cao năng lực suy luận và tạo sinh nội dung cho mô hình.

Alibaba vừa giới thiệu một phương pháp ít tốn kém hơn để cải thiện khả năng tìm kiếm của các mô hình AI - Ảnh: Shutterstock
Đẩy mạnh công nghệ tìm kiếm bằng AI
Nghiên cứu này nằm trong định hướng của Alibaba nhằm đẩy mạnh công nghệ tìm kiếm bằng AI. Tuần trước, gã khổng lồ thương mại điện tử có trụ sở tại thành phố Hàng Châu đã ra mắt tính năng “tìm kiếm sâu” cho Quark, ứng dụng AI phổ biến nhất tại Trung Quốc, theo thống kê của Aicpb.
Aicpb là nền tảng trực tuyến chuyên theo dõi và xếp hạng mức độ phổ biến của các sản phẩm AI, gồm ứng dụng, chatbot và các công cụ khác. Trang web này thường tổng hợp dữ liệu từ nhiều nguồn như lượt tải, mức độ sử dụng, xếp hạng của người dùng và các chỉ số tương tác để đưa ra bảng xếp hạng cập nhật theo thời gian thực.
Hiện tại, Aicpb chủ yếu được biết đến trong cộng đồng công nghệ Trung Quốc như một nguồn tham khảo nhanh về xu hướng ứng dụng AI được ưa chuộng.
Khác với các công cụ tìm kiếm truyền thống dựa vào từ khóa, tính năng “tìm kiếm sâu” sử dụng các mô hình AI Qwen của Alibaba, kết hợp giữa khả năng suy luận và tìm kiếm trực tuyến, để cung cấp câu trả lời chính xác cho các truy vấn phức tạp, theo thông tin từ nhóm phát triển Quark.
“Tìm kiếm sâu” là sản phẩm AI hướng đến người tiêu dùng mới nhất của Alibaba. Gã khổng lồ công nghệ đang tận dụng sức mạnh của các mô hình nền tảng để nâng cao trải nghiệm ứng dụng cho người dùng phổ thông.
“Quark sẽ tập trung vào nhu cầu của người dùng và liên tục cải tiến tính năng 'tìm kiếm sâu' nhằm trở thành trợ lý AI toàn diện”, ông Zhang Fan, người đứng đầu mảng tìm kiếm của Quark, tuyên bố.
Được mệnh danh là “siêu trợ lý”, Quark đã nhanh chóng trở thành ứng dụng AI phổ biến nhất tại Trung Quốc kể từ tháng 3, vượt qua các đối thủ như Doubao thuộc ByteDance (công ty mẹ TikTok) và DeepSeek, theo Aicpb.
Khi người dùng nhập truy vấn vào Quark, hệ thống sẽ phân tích câu hỏi và thực hiện tìm kiếm trực tuyến theo từng giai đoạn. Sau đó, Quark sử dụng kết quả tìm kiếm để tinh chỉnh và điều chỉnh quá trình suy luận rồi đưa ra câu trả lời cuối cùng.
Tính năng “tìm kiếm sâu” hiện có mặt trên Quark ở nhiều nền tảng khác nhau, gồm cả thiết bị di động và máy tính cá nhân.

Ứng dụng Quark được Alibaba quảng bá như một siêu trợ lý AI - Ảnh: Handout
Quark không phải là ứng dụng đầu tiên tại Trung Quốc tích hợp khả năng suy luận AI với tìm kiếm trực tuyến vì chatbot Kimi của công ty khởi nghiệp Moonshot AI (có trụ sở tại thủ đô Bắc Kinh) đã có tính năng tương tự.
Các công ty Trung Quốc khác cũng đang đạt được bước tiến trong công nghệ tìm kiếm bằng AI, trong đó có gã khổng lồ công nghệ Baidu.
Baidu đã tích hợp mô hình suy luận R1 từ công ty khởi nghiệp DeepSeek vào dịch vụ tìm kiếm trực tuyến của mình, giúp cung cấp các kết quả được tóm tắt theo truy vấn của người dùng.
DeepSeek (có trụ sở tại Hàng Châu) cũng triển khai tính năng tìm kiếm theo thời gian thực cho chatbot của mình để nâng cao chất lượng phản hồi.
AI tạo sinh đe dọa công cụ tìm kiếm truyền thống
Trên toàn cầu, ngành tìm kiếm trên internet đang phải đối mặt với những thách thức từ các công cụ AI tạo sinh.
Lượng tìm kiếm trên trình duyệt Safari của iPhone lần đầu tiên giảm sau 22 năm, khi người dùng chuyển sang các chatbot AI để đặt câu hỏi, theo chia sẻ gần đây từ ông Eddy Cue (Phó chủ tịch cấp cao phụ trách dịch vụ tại Apple).
Eddy Cue tiết lộ Apple sẽ bổ sung các nhà cung cấp tìm kiếm AI, gồm cả OpenAI (ChatGPT Search) và Perplexity, làm các tùy chọn tìm kiếm trên Safari trong tương lai, theo hãng tin Bloomberg. Điều này sẽ đe dọa thế độc tôn của Google, vốn chi hàng chục tỉ USD hàng năm để giữ vị trí mặc định cho công cụ tìm kiếm trên Safari thời gian qua.
“Kế hoạch của Apple cũng cho thấy các nền tảng tìm kiếm AI tạo sinh như ChatGPT và Perplexity đã phát triển đến mức nào”, theo Yory Wurmser, nhà phân tích chính tại eMarketer về quảng cáo, truyền thông và công nghệ.
Chẳng hạn, ChatGPT đã ghi nhận hơn 1 tỉ lượt tìm kiếm web mỗi tuần cho tính năng tìm kiếm của mình trong tháng 4. Tính đến tháng 2, chatbot AI của OpenAI có hơn 400 triệu người dùng hoạt động hàng tuần.
Dù phát triển mạnh mẽ, thị phần của chatbot AI vẫn còn nhỏ so với các công cụ tìm kiếm truyền thống, theo nghiên cứu mới đây từ hãng tư vấn Onelittleweb.
Từ tháng 4.2024 đến tháng 3.2025, Google ghi nhận 1.630 tỉ lượt truy cập, tiếp tục giữ vững vị trí công cụ tìm kiếm hàng đầu thế giới. Dù lưu lượng truy cập giảm nhẹ 0,51% so với cùng kỳ năm trước đó, các nhà phân tích cho rằng mức giảm này không đáng kể và cho thấy tầm quan trọng bền vững của Google trong bối cảnh xu hướng kỹ thuật số đang thay đổi.
Alibaba: Qwen3 vượt DeepSeek-R1 và o1 của OpenAI
Cuối tháng 4, Alibaba đã ra mắt thế hệ thứ ba của dòng mô hình Qwen, gồm nhiều phiên bản với lượng tham số khác nhau. Theo Alibaba, mô hình Qwen3 lớn nhất, với 235 tỉ tham số, đã vượt trội hơn mô hình suy luận DeepSeek-R1 và o1 của OpenAI. Phiên bản Qwen3 cân bằng tốt nhất giữa hiệu suất và mức độ tiêu thụ tài nguyên, với 600 triệu tham số, thậm chí có thể chạy trên smartphone, theo nhận định của một số chuyên gia.
Qwen3 được phát triển bằng kiến trúc kết hợp gọi là “hỗn hợp các chuyên gia” (MoE) giống R1. MoE là phương pháp học máy phân chia một mô hình AI thành các mạng con riêng biệt, hay còn gọi là các chuyên gia, mỗi chuyên gia tập trung vào một tập hợp con dữ liệu đầu vào, để cùng nhau thực hiện nhiệm vụ. Cách tiếp cận này được cho giúp giảm đáng kể chi phí tính toán trong quá trình tiền huấn luyện mô hình AI và tăng tốc độ xử lý ở giai đoạn suy luận.
Trong các bài kiểm tra LiveBench về hiệu suất mô hình AI mã nguồn mở, Qwen3 đã vượt R1 về khả năng lập trình, toán học và phân tích dữ liệu.
LiveBench là dạng bài kiểm tra đánh giá hiệu năng mô hình AI, được cập nhật theo thời gian thực hoặc định kỳ với dữ liệu mới nhằm phản ánh năng lực thực tế của các mô hình trong môi trường sử dụng hiện tại.
Dù đứng đầu bảng xếp hạng mã nguồn mở, Qwen3 vẫn xếp sau các mô hình AI nguồn đóng hàng đầu thế giới, theo bài kiểm tra mở rộng của LiveBench. Nổi bật nhất trong số này lần lượt là o3 của OpenAI, Google Gemini Pro 2.5 và Claude 3.7 của Anthropic.