Google DeepMind ra mắt AI Gemini Robotics phiên bản ngoại tuyến

5 giờ trướcGốc

Google DeepMind vừa công bố một phiên bản mới đầy mạnh mẽ của AI Gemini Robotics, có thể chạy trực tiếp trên robot mà không cần kết nối internet.

Được thiết kế để thực hiện các tác vụ phức tạp theo thời gian thực, mô hình nhỏ gọn và hiệu quả này mang lại trí tuệ và khả năng thích ứng ấn tượng cho các cỗ máy.

Gemini Robotics AI hoạt động không cần internet

Nếu bạn từng làm việc với robot, hẳn sẽ biết rằng phần lớn các hệ thống AI hiện nay đều phụ thuộc vào kết nối đám mây. Nhưng giờ đây, Google DeepMind đang thay đổi điều đó với phiên bản Gemini Robotics chạy trên thiết bị (on-device). Phiên bản mới này của mô hình thị giác-ngôn ngữ-hành động (VLA) không cần kết nối Wi-Fi hay dữ liệu di động. Chính xác là nó có thể hoạt động hoàn toàn ngoại tuyến.

Điều này đồng nghĩa với việc robot của bạn có thể “nhìn”, “hiểu” và “hành động” một cách độc lập. Nó có thể thực hiện các tác vụ vật lý và thích ứng với những tình huống mới, tương tự như phiên bản Gemini Robotics cao cấp được phát hành vào tháng 3. Nhưng điểm khác biệt cốt lõi là: phiên bản mới đủ nhỏ gọn và hiệu quả để chạy trực tiếp trên robot, không cần xử lý bên ngoài.

Theo bà Carolina Parada, trưởng bộ phận robot tại Google DeepMind, phiên bản Gemini ban đầu sử dụng hệ thống lai, tức là một phần chạy trên đám mây, một phần trên thiết bị. Tuy nhiên, phiên bản mới này phát huy phần lớn sức mạnh khi chạy hoàn toàn ngoại tuyến, phù hợp với môi trường có kết nối yếu hoặc yêu cầu cao về quyền riêng tư.

Tốc độ học nhanh và khả năng thích ứng cao

Điều đặc biệt ấn tượng ở phiên bản AI chạy trên thiết bị này là tốc độ học cực nhanh. Robot chỉ cần 50 đến 100 lần thao tác mẫu để học một nhiệm vụ mới. Nếu bạn muốn robot của mình phân loại hàng hóa, dọn bàn ăn, hoặc xử lý vật thể tinh xảo, nó có thể thành thạo sau một vài lần quan sát.

Dù mô hình ban đầu được huấn luyện trên robot ALOHA của Google, tính linh hoạt của nó đã được chứng minh khi được tích hợp lên nhiều robot khác nhau: từ robot hình người Apollo của Apptronik đến robot hai tay Franka FR3.

Parada thừa nhận phiên bản lai của Gemini Robotics vẫn vượt trội hơn phiên bản ngoại tuyến ở một số khía cạnh. Tuy nhiên, bà cho biết phiên bản độc lập vẫn cực kỳ mạnh mẽ và có thể là lựa chọn lý tưởng cho những ai mới bắt đầu hoặc các ngành yêu cầu bảo mật dữ liệu cao.

Nhà phát triển có thể truy cập sớm để tinh chỉnh AI

Để hỗ trợ triển khai, Google DeepMind cũng ra mắt bộ công cụ phát triển phần mềm (SDK) cho phiên bản chạy trên thiết bị. Bộ SDK này cho phép các nhà phát triển thử nghiệm AI, tùy chỉnh và tối ưu hóa hiệu suất theo nhu cầu cụ thể của từng robot. Đây là lần đầu tiên DeepMind cung cấp bộ công cụ chính thức cho một hệ thống VLA của họ.

Dù mô hình và SDK này chưa được phát hành rộng rãi, một nhóm người dùng thử nghiệm đáng tin cậy sẽ được tiếp cận sớm. Trong lúc đó, DeepMind sẽ đảm bảo công nghệ đáp ứng các tiêu chuẩn an toàn trước khi phát hành công khai.

Nếu bạn đang phát triển các giải pháp robot và cần một AI hiệu suất cao hoạt động trong môi trường ngoại tuyến hoặc bảo mật, đây có thể chính là đột phá bạn đang chờ đợi từ Google DeepMind.

Anh Tú

Nguồn Một Thế Giới: https://1thegioi.vn/google-deepmind-ra-mat-ai-gemini-robotics-phien-ban-ngoai-tuyen-234161.html