Bên trong phòng thí nghiệm robot hình người của Trung Quốc

Trung Quốc đã khiến thế giới ngỡ ngàng với trình độ phát triển robot hình người trong dịp Tết Nguyên Đán. Và người ta bắt đầu tìm hiểu cách phát triển robot.

Tại một cơ sở rộng 12.000 mét vuông ở Vũ Hán, những thanh niên Trung Quốc mới tốt nghiệp đang dành toàn bộ thời gian làm việc để điều khiển các cỗ máy hình người. Công việc hằng ngày của họ xoay quanh những thao tác gia đình quen thuộc như phục vụ bánh bao hấp, lau dọn mặt bàn và gấp nếp quần áo. Mọi chuyển động vi tế nhất của máy móc bên trong các gian bếp và phòng ngủ nhân tạo thuộc phòng thí nghiệm trị giá 200 triệu nhân dân tệ này đều được hệ thống camera cùng cảm biến theo dõi sát sao và ghi chép lại.

Robot hình người Trung Quốc ghi điểm tại Vãn Xuân

Robot hình người Trung Quốc ghi điểm tại Vãn Xuân

Sự xuất hiện của Trung tâm Đổi mới Robot Hình người Hồ Bắc phản ánh một chiến dịch công nghệ quy mô lớn do nhà nước hậu thuẫn. Nơi đây là một trong hàng chục công xưởng huấn luyện vừa mọc lên trên khắp Trung Quốc với mục tiêu xây dựng một kho dữ liệu khổng lồ, đóng vai trò sống còn trong việc cấy ghép "bộ não" trí tuệ nhân tạo vào các thực thể cơ khí. Giới chức Bắc Kinh đặt kỳ vọng rất lớn vào việc tích lũy nguồn tài nguyên số này nhằm giúp ngành công nghiệp robot hình người non trẻ vượt qua những giới hạn hiện tại, đưa công nghệ thông minh thoát khỏi màn hình máy tính để bước thẳng vào không gian vật lý.

Công xưởng đúc kết "linh hồn" cho cỗ máy vật lý

Quá trình thu thập dữ liệu cho robot mang những đặc thù hoàn toàn khác biệt so với việc phát triển các mô hình ngôn ngữ lớn. Những nền tảng trí tuệ nhân tạo đình đám như ChatGPT hay DeepSeek được nuôi dưỡng bằng cách cào trích xuất những khối lượng văn bản khổng lồ có sẵn trên mạng internet. Việc thu thập dữ liệu về chuyển động vật lý của robot hiện vẫn đang ở giai đoạn bình minh. Con người phải trực tiếp can thiệp và tạo ra từng dòng dữ liệu thô thông qua hoạt động tương tác tay chân.

Tại cơ sở Vũ Hán, Zhang Jia, một giám đốc chương trình 21 tuổi, đang giám sát một đội ngũ gồm 70 hướng dẫn viên trẻ tuổi. Đội ngũ này làm việc theo các ca kéo dài tám giờ đồng hồ, sử dụng bộ điều khiển từ xa hoặc các thiết bị cầm tay trang bị cảm biến để điều hướng 46 cỗ máy thực hiện đi thực hiện lại một chuỗi cử động cố định.

Khối lượng công việc lặp lại mang tính chất cơ học này đòi hỏi một sự kiên nhẫn phi thường. Việc truyền đạt kiến thức cho một thực thể nhân tạo khắc nghiệt hơn rất nhiều so với quá trình hướng dẫn con người. Một sinh viên có thể nắm bắt cách rót nước sau vài lần quan sát. Các kỹ sư tại đây phải lặp lại thao tác đó hàng trăm, hàng nghìn, thậm chí hàng vạn lần để máy móc ghi nhớ. Ở khu vực lân cận của phòng thí nghiệm, những dãy nhân viên cắm cúi xem xét các đoạn băng ghi hình thu được từ hệ thống.

Họ cẩn thận gán nhãn cho từng vài giây của đoạn video bằng những chú thích chuyên môn như "xoay sang trái" hoặc "mở rộng cánh tay". Theo chia sẻ của Zhang, cơ sở này sản xuất khoảng 100 giờ dữ liệu có thể sử dụng được mỗi ngày. Toàn bộ dữ liệu sau khi thu thập và phân loại sẽ được tải lên nền tảng trung tâm để tiếp tục xử lý, phục vụ cho một giai đoạn khám phá công nghệ mang tính chất tiên phong.

Nỗ lực khổng lồ này nằm gọn trong tầm nhìn vĩ mô của Chủ tịch Tập Cận Bình nhằm đưa Trung Quốc vươn lên vị thế siêu cường khoa học và công nghệ số một thế giới. Trong bản kế hoạch năm năm giai đoạn 2026-2030 được công bố vào tuần trước, Bắc Kinh đã chính thức định danh "trí tuệ hiện thân" là một trong 6 ngành công nghiệp của tương lai cần được ưu tiên vun đắp. Văn kiện này kêu gọi sự phát triển đồng bộ của các trung tâm huấn luyện, mô hình học máy và thiết bị phần cứng nhằm đẩy nhanh quá trình thương mại hóa robot hình người.

Trên bình diện quốc tế, các tập đoàn tại Mỹ cũng đang theo đuổi những phương pháp thu thập dữ liệu đa dạng. Tesla đã bắt đầu thử nghiệm việc sử dụng các đoạn video trình diễn của con người để huấn luyện nguyên mẫu Optimus. Công ty khởi nghiệp 1X Technologies tại Thung lũng Silicon lại lựa chọn giải pháp đưa cỗ máy vào các hộ gia đình để con người điều khiển từ xa trong quá trình học hỏi.

Giải mã rào cản dữ liệu và bài toán tương thích phần cứng

Ý tưởng cốt lõi của các công xưởng huấn luyện là chuyển hóa sự vật lý hóa thành các thuật toán toán học. Hàng loạt chỉ số cảm biến và đoạn video ghi lại vị trí tọa độ, vận tốc di chuyển và lực mô-men xoắn của các khớp nối robot sẽ được đưa vào làm thức ăn cho các mô hình học máy. Thuật ngữ chuyên ngành gọi đây là các mô hình "hành động ngôn ngữ thị giác".

Mục tiêu của quy trình này là tái tạo lại những bước nhảy vọt từng xuất hiện trên các mô hình ngôn ngữ lớn, áp dụng trực tiếp vào lĩnh vực cơ khí tự động. Giới khoa học kỳ vọng máy móc sẽ học được các kỹ năng tổng quát hóa cao độ, tự động biết cách cầm lên một chai nước mà không cần kỹ sư phải viết từng dòng lệnh lập trình cứng cho thao tác đó.

Việc thu thập dữ liệu với quy mô đủ lớn để tạo ra sự đột biến về trí thông minh là một thử thách vô cùng khắc nghiệt. Zhao Xiang, người đồng sáng lập Motphys, một công ty khởi nghiệp chuyên xây dựng nền tảng mô phỏng trí tuệ hiện thân, khẳng định một bước đột phá thực sự có thể cần đến hàng trăm triệu, thậm chí hàng tỉ giờ dữ liệu tích lũy.

Để giải quyết bài toán thời gian và chi phí, các kỹ sư trẻ tại phòng thí nghiệm Vũ Hán được trang bị kính thực tế ảo (VR) để trực tiếp huấn luyện cỗ máy trong không gian kỹ thuật số. Môi trường mô phỏng đóng vai trò là một giải pháp thay thế hiệu quả, cho phép máy móc trải qua vô số chu kỳ học hỏi với chi phí thấp hơn nhiều so với việc vận hành hao mòn cơ học trên thực địa.

Các thanh niên đang luyện robot từng động tác

Các thanh niên đang luyện robot từng động tác

Mặc dù vậy, tham vọng của Trung Quốc đang phải đối mặt với một rào cản vật lý mang tính nền tảng. Dữ liệu vận động thu thập được từ một nguyên mẫu robot không thể dễ dàng chuyển giao hay tái sử dụng để nạp vào một thiết bị sở hữu cấu trúc phần cứng khác biệt. Ngành công nghiệp cơ khí đang tiến hóa với tốc độ chóng mặt.

Nguồn dữ liệu đắt đỏ được tổng hợp ở thời điểm hiện tại hoàn toàn có nguy cơ trở nên vô dụng đối với thiết kế của các phiên bản ra mắt vào năm sau. Khả năng chuyển giao dữ liệu chéo giữa các hệ thống vẫn là một lĩnh vực nghiên cứu đầy thách thức, dù giới công nghệ kỳ vọng những bước tiến mới sẽ sớm xuất hiện. Các mô hình trí tuệ nhân tạo chuyên dụng cho cơ khí của Google DeepMind đã cho thấy những dấu hiệu khả quan ban đầu trong việc duy trì kỹ năng khi hoán đổi nền tảng phần cứng.

Động lực kinh tế nhà nước và những mảng tối thực tế

Chiến lược phát triển ngành công nghiệp tự động hóa đến cuối năm 2027 do Bộ Công nghiệp và Công nghệ Thông tin Trung Quốc phác thảo đã định hình rõ đường hướng hành động. Văn bản này xác định các cơ sở dữ liệu quy mô lớn và dữ liệu đa phương thức chất lượng cao là hạt nhân trung tâm để xây dựng "bộ não" cho máy móc hình người. Hưởng ứng lời kêu gọi từ trung ương, chính quyền các địa phương, từ thành phố duyên hải giàu có Hàng Châu đến đô thị nhỏ sâu trong đất liền như Miên Dương, đang ồ ạt rót những nguồn vốn khổng lồ cho các cơ sở huấn luyện.

Riêng tỉnh Hồ Bắc, nơi đặt trụ sở phòng thí nghiệm Vũ Hán, đã công bố một quỹ nhà nước trị giá 10 tỉ nhân dân tệ dành riêng cho việc phát triển lĩnh vực này. Jay Huang, chuyên gia nghiên cứu công nghệ công nghiệp châu Á tại tập đoàn Bernstein, đánh giá sự can thiệp của chính phủ mang lại lợi ích chia sẻ dữ liệu đồng đều, tạo ra một lực đẩy vĩ mô buộc toàn bộ hệ sinh thái doanh nghiệp tiến về chung một hướng.

Ngay cả những nhà nghiên cứu hàng đầu và các kỹ sư đang trực tiếp thực hiện chiến dịch gom nhặt dữ liệu cũng thừa nhận sự mơ hồ về kết quả công nghệ cuối cùng. Tuy nhiên, luồng tiền khổng lồ từ nhà nước đang tạo ra một hiệu ứng kinh tế cứu sinh vô cùng thiết thực. Việc các trung tâm huấn luyện vung tiền mua sắm trang thiết bị đã trực tiếp nuôi sống các nhà sản xuất nội địa trong giai đoạn nhu cầu sử dụng thực tế của thị trường vẫn còn rất mờ nhạt.

Trung tâm Vũ Hán đã thanh toán cho công ty AgiBot có trụ sở tại Thượng Hải số tiền 350.000 nhân dân tệ cho mỗi nguyên mẫu robot để trang bị cho phòng thí nghiệm. Các chuyên gia phân tích từ Bernstein ước tính doanh số bán hàng phục vụ mục đích thu thập dữ liệu đã chiếm tới khoảng một phần năm trong tổng số hơn 20.000 lô hàng robot hình người được xuất xưởng tại thị trường Trung Quốc vào năm ngoái.

Robot được hướng dẫn làm việc nhà

Robot được hướng dẫn làm việc nhà

Đằng sau bức tranh đầu tư sôi động và những tham vọng định hình tương lai, thực tế tại các trung tâm này vẫn tồn tại những góc khuất mang đậm tính chất phô diễn. Tại một cơ sở thu thập dữ liệu khác, hàng chục cỗ máy hình người được treo lơ lửng, hoàn toàn bất động ở một bên sảnh chính tráng lệ. Một nhân viên làm việc tại đây đã thẳng thắn chia sẻ bức màn bí mật đằng sau sự hiện diện của chúng. Những cỗ máy đắt tiền này hoàn toàn không được kết nối vào hệ thống để phục vụ công tác thu thập dữ liệu huấn luyện. Chúng được bố trí ở đó với mục đích duy nhất là thực hiện các màn trình diễn biểu diễn cơ học đẹp mắt mỗi khi có các phái đoàn quan chức cấp cao đến tham quan và kiểm tra tiến độ dự án.

Bùi Tú

Nguồn Một Thế Giới: https://1thegioi.vn/ben-trong-phong-thi-nghiem-robot-hinh-nguoi-cua-trung-quoc-248588.html