Manus - 'DeepSeek thứ hai' của Trung Quốc gặp lỗi liên tục, có xứng đáng với sự cường điệu?

Dù nền tảng AI 'đại lý' này đang tạo ra làn sóng phấn khích trên toàn cầu, nhưng liệu nó có thực sự là một 'khoảnh khắc DeepSeek thứ hai' của Trung Quốc hay chỉ đơn giản là một cơn sốt đầu cơ được thổi phồng quá mức?

Theo TechCrunch, chỉ trong một tuần sau khi ra mắt bản xem trước, Manus đã nhanh chóng trở thành tâm điểm chú ý trong cộng đồng AI.

Nhiều chuyên gia công nghệ đã đánh giá cao nền tảng này, trong đó Trưởng bộ phận sản phẩm tại Hugging Face nhận định đây là "công cụ AI ấn tượng nhất mà tôi từng thử", còn nhà nghiên cứu AI Dean Ball mô tả nó như "máy tính AI tiên tiến nhất từng tồn tại".

Sự quan tâm dành cho Manus cũng được thể hiện qua việc máy chủ Discord chính thức của nền tảng này thu hút hơn 138.000 thành viên chỉ trong vài ngày, trong khi các mã mời thử nghiệm được giao dịch với giá hàng nghìn USD trên Xianyu.

Với sự cường điệu này, nhiều người kỳ vọng Manus sẽ trở thành bước tiến lớn của Trung Quốc trong cuộc đua AI toàn cầu, nhưng liệu thực tế có phản ánh đúng những kỳ vọng đó?

Manus gây sốt toàn cầu nhưng bị nghi ngờ về năng lực thực sự, chủ yếu nhờ chiến lược độc quyền, truyền thông thổi phồng và FOMO - Ảnh: TechCrunch

Manus gây sốt toàn cầu nhưng bị nghi ngờ về năng lực thực sự, chủ yếu nhờ chiến lược độc quyền, truyền thông thổi phồng và FOMO - Ảnh: TechCrunch

Sự thật đằng sau Manus: Có phải một bước đột phá?

Trái với những lời tung hô, Manus không hoàn toàn là một sản phẩm AI phát triển từ con số 0. Theo các phân tích trên mạng xã hội, nền tảng này chỉ là sự kết hợp của các mô hình AI hiện có, được tinh chỉnh để thực hiện một số tác vụ cụ thể.

Các báo cáo chỉ ra rằng Manus sử dụng nền tảng Claude của Anthropic và Qwen của Alibaba làm cốt lõi cho hệ thống AI của mình. Dù vậy, công ty đứng sau Manus, The Butterfly Effect, vẫn đang quảng bá nền tảng này như một sản phẩm mang tính đột phá, có thể mua bất động sản, lập trình trò chơi điện tử và thậm chí quản lý tài chính cá nhân.

Trong một video lan truyền trên mạng, Yichao "Peak" Ji, trưởng nhóm nghiên cứu của Manus, tuyên bố rằng nền tảng này vượt trội hơn các công cụ AI tiên tiến của OpenAI và đạt điểm cao hơn trên thang đo GAIA, một chuẩn đánh giá khả năng tác vụ của AI. Tuy nhiên, trải nghiệm thực tế của người dùng ban đầu lại không phản ánh điều đó.

Alexander Doria, đồng sáng lập công ty AI Pleias, cho biết ông gặp phải lỗi liên tục và vòng lặp vô tận khi thử nghiệm Manus. Nhiều người dùng khác cũng phản ánh rằng nền tảng này thường mắc lỗi trong các câu hỏi thực tế, không trích dẫn nguồn chính xác và bỏ sót những thông tin cơ bản có thể dễ dàng tìm thấy trực tuyến.

Chẳng hạn, khi yêu cầu Manus đặt một chiếc bánh sandwich gà rán từ một quán ăn nhanh gần nhất, hệ thống sập sau 10 phút. Lần thử thứ hai, nó tìm được món ăn phù hợp nhưng không thể hoàn tất đặt hàng hoặc cung cấp liên kết thanh toán. Khi thử đặt vé máy bay từ Mỹ đến Nhật Bản, Manus chỉ trả về danh sách liên kết giá vé, trong đó có nhiều liên kết bị hỏng. Với yêu cầu xây dựng một trò chơi chiến đấu lấy cảm hứng từ Naruto, sau 30 phút tải, nền tảng thông báo lỗi.

Những hạn chế này cho thấy mặc dù Manus có tiềm năng, nhưng ở thời điểm hiện tại, nền tảng này vẫn chưa đủ mạnh để trở thành một AI tác nhân tự chủ thực sự.

Lý do đằng sau sự cường điệu quá mức của Manus

Mặc dù không sở hữu công nghệ đột phá như quảng cáo, Manus vẫn tạo ra cơn sốt nhờ vào một số yếu tố quan trọng. Trước hết, chiến lược độc quyền và tâm lý FOMO (Fear of Missing Out – nỗi sợ bỏ lỡ) đóng vai trò lớn.

Việc giới hạn số lượng lời mời thử nghiệm khiến Manus trở thành một sản phẩm "xa xỉ" trong cộng đồng AI. Các vé mời trở thành món hàng đắt giá, được giao dịch với giá cao trên các nền tảng chợ đen, kích thích sự tò mò và tạo ra hiệu ứng tâm lý mạnh mẽ.

Bên cạnh đó, truyền thông Trung Quốc đã góp phần không nhỏ vào việc đẩy sự kỳ vọng lên cao. Các bài viết trên phương tiện truyền thông mô tả Manus như một bước tiến vượt bậc trong lĩnh vực AI, trong khi QQ News gọi nó là “niềm tự hào của AI Trung Quốc” dù thực tế nền tảng này không sở hữu bất kỳ mô hình AI nội bộ nào. Đồng thời, sự lan truyền thông tin sai lệch cũng góp phần tạo nên sự cường điệu xung quanh sản phẩm.

Một video lan truyền trên mạng xã hội cho thấy một chương trình máy tính thực hiện nhiều tác vụ trên ứng dụng di động, được cho là Manus, nhưng sau đó Ji xác nhận đây không phải bản demo thực tế.

Một số tài khoản AI có ảnh hưởng thậm chí còn so sánh Manus với DeepSeek, dù trên thực tế hai nền tảng này hoàn toàn khác nhau. DeepSeek phát triển công nghệ AI của riêng mình, trong khi Manus chủ yếu tận dụng các mô hình có sẵn từ các công ty khác.

Hiện tại, Manus vẫn đang trong giai đoạn thử nghiệm beta và công ty phát triển tuyên bố họ đang tiếp tục cải thiện hệ thống, mở rộng năng lực tính toán và khắc phục lỗi. Tuy nhiên, sự cường điệu xung quanh sản phẩm đã vượt xa khả năng thực tế của nó. Nếu không có những đột phá công nghệ đáng kể, Manus rất có thể sẽ trở thành một ví dụ điển hình của “cường điệu đi trước đổi mới”.

Xét về tiềm năng, Manus có thể là một sản phẩm đáng chú ý nhưng chưa đủ sức tạo ra bước tiến đột phá như những gì đang được quảng bá. Nó không phải là một "DeepSeek thứ hai" và cũng chưa đạt đến đẳng cấp của những nền tảng AI hàng đầu như OpenAI hay Anthropic. Tuy nhiên, nền tảng này vẫn còn cơ hội để cải thiện và chứng minh giá trị thực sự. Nếu không thể mang lại những cải tiến đáng kể, Manus có nguy cơ trở thành một cơn sốt thoáng qua trong ngành công nghệ AI.

Hoàng Vũ

Nguồn Một Thế Giới: https://1thegioi.vn/manus-deepseek-thu-hai-cua-trung-quoc-gap-loi-lien-tuc-co-xung-dang-voi-su-cuong-dieu-230247.html