Manus: DeepSeek tiếp theo của Trung Quốc

AI Agent được xem là bước tiến tiếp theo của ngành AI Trung Quốc, để chống lại đối thủ Mỹ.

 Manus được quảng cáo là AI Agent phổ quát đầu tiên trên thế giới. Ảnh: IDR.

Manus được quảng cáo là AI Agent phổ quát đầu tiên trên thế giới. Ảnh: IDR.

Manus, ứng dụng trí tuệ nhân tạo gây sốt ở Trung Quốc khi vừa được giới thiệu. Người hâm mộ ví nó như DeepSeek tiếp theo, AI Agent (tác tử) phổ thông đầu tiên trên thế giới.

Theo lời mô tả ở website, Manus có thể giúp lập kế hoạch du lịch, phân tích diễn biến giá cổ phiếu, tạo giáo trình giảng dạy đến phân tích hợp đồng. Khả năng ứng dụng mạnh mẽ và sâu sắc ở nhiều lĩnh vực khiến nó gây chú ý. Theo China Business News, giá những mã giới thiệu dùng thử Manus hiện được rao ở mức 90.000 NDT (317 triệu đồng).

Manus là gì?

Manus được giới thiệu là sản phẩm AI Agent, được Butterfly Effect, có trụ sở tại Bắc Kinh và Vũ Hán (Trung Quốc) phát triển. Trong các đoạn quảng cáo, nó được giới thiệu khả năng phân tích dữ liệu theo từ khóa. AI này cũng xếp loại giá nhà dựa trên nhu cầu và thu nhập của chủ nhân. Công cụ được thử nghiệm thêm ở tác vụ nghiên cứu cổ phiếu Nvidia, Tesla.

Thông thường, người dùng tương tác với AI bằng cách đưa yêu cầu, chúng phản hồi. Quy trình cứ như vậy tiếp diễn. Agent như Manus tối giản thao tác. Sau lệnh ban đầu, nó tự động tìm kiếm, suy nghĩ về bước tiếp theo để thực thi.

Các ví dụ về khả năng làm việc của Manus. Ảnh: Manus.

Các ví dụ về khả năng làm việc của Manus. Ảnh: Manus.

Trong đoạn giới thiệu, chủ nhân yêu cầu Manus tạo file trình chiếu giới thiệu về xe Xiaomi SU7. Sau đó, AI tự mình thu thập thông tin và thực thi chính xác lệnh. Trên website chính thức, Manus cho biết nó đạt điểm SOTA trong bài kiểm tra GAIA cao hơn đáng kể so với sản phẩm của OpenAI. Chỉ số này chứng tỏ AI này làm tốt trong việc giải quyết vấn đề thực tế.

Còn nhiều vấn đề

Chuyên trang Guokr đã gửi thư yêu cầu mã thử Manus và nằm trong số ít đơn vị được chấp thuận. Tuy nhiên trải nghiệm của họ không như ý. Nhóm bị kẹt ở trang đăng nhập từ 9h đến 13h30 dù có mã trong tay.

Những người thử nghiệm nội bộ chỉ có thể yêu cầu 10 nhiệm vụ mỗi ngày. Khi Guokr kiểm tra trí tuệ cảm xúc bằng yêu cầu “tạo meme”, Manus không phản hồi vì vượt giới hạn tối đa.

Ở lệnh code một trang web xem giờ quốc tế, Manus có thể thực thi dưới dạng mã html, có giao diện đẹp mắt, thân thiện. Họ thử với một tác vụ phức tạp hơn là tìm trò chơi trên mạng. Nó thậm chí lấy được giao diện trang web miễn phí, mở game và tự chọn xe để đua theo lệnh.

Manus tự tìm và chơi game theo lệnh. Ảnh: Guokr.

Manus tự tìm và chơi game theo lệnh. Ảnh: Guokr.

Tuy nhiên, khi trò chơi bắt đầu, chiếc xe của Manus không chạy. Chủ nhân phải thêm yêu cầu “điều khiển bằng WASD”, nó mới di chuyển. Ví dụ cho thấy AI Agent này đạt được mức độ tự chủ nhất định trong hành vi. Yếu tố nói trên quan trọng để hoàn thành công việc độc lập.

Tuy nhiên, các nhà nghiên cứu cũng chỉ ra nhiều vấn đề lớn từ AI này. Manus bị nghi vấn chỉ là bản sao công cụ nước ngoài. Chức năng lõi của nó rất giống ComputerUse từ Anthropic. Khả năng lập kế hoạch tự động lại gọi api từ mô hình ngôn ngữ lớn (như GPT-4). Trong trường hợp phân tích cổ phiếu, Manus chỉ lấy dữ liệu Yahoo Finance, rồi lập biểu đồ dựa trên tập lệnh Python.

Guokr yêu cầu Manus tạo một trang web chúc mừng sinh nhật lãng mạn. Tuy nhiên, nó không thể tạo mã có khả năng tương tác như yêu cầu. Yếu tố thẩm mỹ bị đánh giá thấp, dù người dùng ra lệnh chỉnh sửa. Các tác vụ tìm kiếm, tổng hợp thông tin và viết báo cáo của Manus cũng kém hơn các đối thủ trên thị trường.

Dù vậy, sản phẩm nói trên vẫn mang đến nhiều kỳ vọng cho Trung Quốc trong ngành công nghiệp AI. Manus vẫn trong giai đoạn thử nghiệm giới hạn, không tiếp cận được với tài nguyên card đồ họa chất lượng cao của Nvidia.

Hùng Phi

Nguồn Znews: https://znews.vn/manus-deepseek-tiep-theo-cua-trung-quoc-post1536914.html