CES 2025: Nvidia định nghĩa lại trợ lý AI với R2X

Nvidia vừa giới thiệu một nguyên mẫu avatar AI mang tên R2X tại CES 2025, hứa hẹn mở ra một giao diện tương tác hoàn toàn mới giữa con người và máy tính, theo TechCrunch.

Hiện diện trực tiếp trên màn hình, R2X được thiết kế như một nhân vật hoạt hình sống động, có khả năng hỗ trợ người dùng điều hướng và xử lý các ứng dụng trên máy tính. Sản phẩm này kết hợp những tiến bộ vượt bậc về đồ họa và trí tuệ nhân tạo, đánh dấu bước tiến mới trong cách con người tương tác với công nghệ.

Kết hợp AI và đồ họa 3D

R2X không chỉ là một trợ lý AI thông thường mà còn là một hình đại diện 3D sống động, được phát triển với sự hỗ trợ của các mô hình trí tuệ nhân tạo tiên tiến của Nvidia. Người dùng có thể tương tác với avatar này thông qua giọng nói hoặc văn bản, cho phép nó xử lý tài liệu, cung cấp hướng dẫn và thậm chí theo dõi hoạt động trên màn hình hoặc camera máy tính của người dùng.

Trợ lý ảo AI của Nvidia được giới thiệu tại CES 2025 - Ảnh: Techcrunch

Trợ lý ảo AI của Nvidia được giới thiệu tại CES 2025 - Ảnh: Techcrunch

Đáng chú ý, R2X có thể hoạt động trên các mô hình ngôn ngữ lớn (LLM) phổ biến như GPT-4o của OpenAI hoặc Grok của xAI, mang lại sự linh hoạt trong việc lựa chọn nền tảng AI. Điều này giúp avatar tương thích với nhiều loại phần mềm và mục đích sử dụng khác nhau, từ xử lý văn bản đến hỗ trợ công việc chuyên môn.

Nvidia đã tích hợp nhiều công nghệ đồ họa tiên tiến vào R2X. Cụ thể, thuật toán khuôn mặt thần kinh RTX được sử dụng để tạo ra các biểu cảm khuôn mặt chân thực, trong khi mô hình Audio2Face-3D tự động đồng bộ hóa chuyển động môi và lưỡi với giọng nói của hình đại diện. Những tính năng này giúp R2X có giao diện và cử động gần giống con người, dù đôi khi vẫn gặp phải những trục trặc nhỏ khiến avatar có vẻ hơi "kỳ lạ".

Trong một số bản demo, R2X đã thể hiện khả năng xử lý tệp PDF, cung cấp thông tin chính xác và trả lời câu hỏi dựa trên nội dung tài liệu nhờ vào tính năng truy xuất tăng cường cục bộ (RAG). Tính năng này cho phép avatar lấy dữ liệu từ tài liệu cụ thể và xử lý chúng thông qua các mô hình ngôn ngữ lớn.

Tương tác với ứng dụng

Một trong những điểm nổi bật của R2X là khả năng hỗ trợ trực tiếp trong các ứng dụng. Trong một bản demo, avatar này đã hướng dẫn cách sử dụng tính năng tô màu tạo sinh trong Adobe Photoshop. Tuy nhiên, avatar gặp lỗi khi đưa ra hướng dẫn sai và mất khả năng xem màn hình, chỉ khôi phục được sau khi chuyển đổi sang một mô hình AI khác.

Dù còn một số hạn chế, Nvidia tin rằng R2X có thể trở thành công cụ hữu ích trong các tác vụ phức tạp như mã hóa, chỉnh sửa hình ảnh, và quản lý dự án. Ngoài ra, công ty đang làm việc để tích hợp avatar này vào các nền tảng họp trực tuyến như Microsoft Teams, với mục tiêu biến nó thành một trợ lý cá nhân đắc lực.

R2X có khả năng chụp ảnh màn hình liên tục để phân tích và đưa ra phản hồi, nhưng tính năng này bị tắt mặc định để tránh các lo ngại về quyền riêng tư. Nvidia cho biết họ sẽ cung cấp tùy chọn tùy chỉnh mức độ can thiệp của R2X, cho phép người dùng kiểm soát những gì avatar có thể theo dõi và phân tích.

Tiềm năng và thách thức

Nvidia đặt mục tiêu mở mã nguồn avatar R2X vào giữa năm 2025, cho phép các nhà phát triển tự do tích hợp và nâng cấp công nghệ này. Điều này có thể mở đường cho các ứng dụng rộng rãi hơn, từ khách hàng doanh nghiệp đến người tiêu dùng cá nhân. Tuy nhiên, để đạt được tiềm năng đầy đủ, Nvidia cần giải quyết các vấn đề như tính ổn định của mô hình AI, quyền riêng tư, và tích hợp với các hệ thống phần mềm khác.

Bên cạnh đó, Nvidia đang làm việc để phát triển các tính năng "đại lý" (agent capabilities) cho R2X, cho phép avatar này thực hiện các hành động phức tạp hơn trên máy tính, như quản lý tập tin hoặc tự động hóa các tác vụ văn phòng. Những tính năng này đòi hỏi sự hợp tác chặt chẽ với các đối tác phần mềm lớn như Microsoft và Adobe, vốn cũng đang phát triển các giải pháp tương tự.

Mặc dù R2X mang lại nhiều tiện ích, một số người dùng cảm thấy không thoải mái khi có một hình đại diện giống con người nhìn chằm chằm vào màn hình trong khi họ làm việc. Những trục trặc kỹ thuật như khuôn mặt bị kẹt ở tư thế không tự nhiên hoặc giọng điệu có phần "hung hăng" càng làm tăng thêm cảm giác kỳ lạ này. Tuy nhiên, Nvidia tin rằng những vấn đề này có thể được khắc phục trong các bản cập nhật tương lai.

R2X là một bước tiến đầy tham vọng của Nvidia trong việc đưa AI và đồ họa 3D vào cuộc sống hàng ngày. Mặc dù còn một số lỗi cần khắc phục, công nghệ này hứa hẹn mang lại những cách thức mới để tương tác với máy tính và phần mềm.

Hoàng Vũ

Nguồn Một Thế Giới: https://1thegioi.vn/ces-2025-nvidia-dinh-nghia-lai-tro-ly-ai-voi-r2x-228108.html