ByteDance ra mắt 'bộ não' AI cho phép robot dọn dẹp, phơi quần áo
Chủ sở hữu TikTok, công ty ByteDance, ra mắt hệ thống robot trong bước tiến mới về trí tuệ nhân tạo (AI).

Mẫu ByteDance GR-3 cho phép robot thực hiện các nhiệm vụ như treo quần áo. Ảnh: Handout.
Công ty ByteDance – chủ sở hữu TikTok và là một trong những doanh nghiệp đặt ưu tiên hàng đầu vào phát triển AI – vừa giới thiệu một hệ thống hoạt động như “bộ não” giúp robot thực hiện các công việc gia đình như phơi quần áo và lau bàn.
Theo thông tin đăng trên trang web của công ty vào ngày 22/7, GR-3 là một mô hình thị giác-ngôn ngữ-hành động quy mô lớn, cho phép robot hiểu và làm theo các hướng dẫn bằng ngôn ngữ tự nhiên, thực hiện các nhiệm vụ phổ quát ngay cả với những vật thể chưa từng thấy, trong môi trường mới hoặc khi đối mặt với các khái niệm trừu tượng liên quan đến kích thước và vị trí không gian.
Trong một đoạn video trên website, ByteDance cho biết khi được tích hợp với GR-3, nguyên mẫu robot di động hai tay trong phòng thí nghiệm của công ty – có tên là ByteMini – có thể cho móc áo vào áo sơ mi và treo lên giá phơi.
Trong một báo cáo kỹ thuật riêng biệt, nhóm phát triển cho biết robot có thể xử lý cả áo ngắn tay dù toàn bộ dữ liệu huấn luyện đều là áo dài tay.
Được hỗ trợ bởi GR-3, robot còn có thể làm theo hướng dẫn để nhặt một món đồ cụ thể từ một nhóm đồ vật và đặt nó vào vị trí được chỉ định. Hệ thống này có thể nhận biết một vật thể không chỉ dựa vào tên gọi mà còn dựa vào kích thước – ví dụ như “đĩa to hơn” – hoặc vị trí không gian, như “ở bên trái”.
Hệ thống còn có thể tự động hoàn thành toàn bộ nhiệm vụ như “dọn bàn ăn” chỉ với một câu lệnh duy nhất.

Robot cũng có thể làm theo hướng dẫn để nhặt từng vật phẩm và đặt vào vị trí được chỉ định. Ảnh: Handout.
ByteDance – trụ sở tại Bắc Kinh – cho biết để huấn luyện mô hình này, công ty đã sử dụng một quy trình huấn luyện đa chiều bao gồm học đồng thời với lượng lớn dữ liệu thị giác-ngôn ngữ, tinh chỉnh từ dữ liệu chuyển động của con người thu thập qua thiết bị thực tế ảo (VR), và học bắt chước từ dữ liệu chuyển động của robot.
“Chúng tôi hy vọng GR-3 sẽ là một bước tiến hướng tới việc xây dựng các robot đa năng có khả năng hỗ trợ con người trong cuộc sống hàng ngày”, nhóm nghiên cứu chia sẻ.
Dự án này là một thành tựu lớn đến từ bộ phận Seed của ByteDance – đơn vị phụ trách mảng nghiên cứu AI và phát triển các mô hình ngôn ngữ lớn của công ty.
Bộ phận Seed được thành lập vào năm 2023, sau khi OpenAI ra mắt ChatGPT vào tháng 11/2022, khơi mào cho một cuộc đua toàn cầu về AI tạo sinh.
Tính đến ngày 24/7, nhóm Seed đã đăng hơn 15 vị trí tuyển dụng liên quan đến robot và AI hiện thân – khái niệm chỉ việc ứng dụng AI vào các hệ thống vật lý như robot. Một số tin tuyển dụng cho biết công ty đang phát triển một “sản phẩm mới”.
Sự tập trung vào AI và robot phản ánh ưu tiên chiến lược của ông Trương Nhất Minh (Zhang Yiming) – đồng sáng lập ByteDance. Dù hiện sống tại Singapore, ông vẫn thường xuyên di chuyển tới Bắc Kinh, nơi có nhiều nhà nghiên cứu AI chủ chốt của công ty, để nắm sát tiến độ nghiên cứu và phát triển, theo thông tin từ tờ South China Morning Post hồi tháng trước.
Ông Trương, người đã rời khỏi vai trò CEO và Chủ tịch từ năm 2021, không còn tham gia vào công việc điều hành thường nhật, nhưng vẫn có ảnh hưởng lớn trong các quyết định chiến lược của công ty.