Đột phá công nghệ giúp robot hình người trò chuyện tự nhiên
Bằng cách cho robot theo dõi hàng giờ video trên YouTube và tự soi gương để điều chỉnh, nhóm chuyên gia đã giúp cỗ máy này làm chủ các biểu cảm khuôn mặt và cử động môi khớp với lời nói một cách hoàn hảo.

Robot theo dõi hàng giờ video trên YouTube giúp giao tiếp tự nhiên hơn. Ảnh: BGR.
Các nhà nghiên cứu tại Đại học Columbia vừa công bố một nghiên cứu chấn động trên tạp chí Science về phương pháp giúp robot hình người có diện mạo và giọng nói giống hệt người thật. Bằng cách cho robot theo dõi hàng giờ video trên YouTube và tự soi gương để điều chỉnh, nhóm chuyên gia đã giúp cỗ máy này làm chủ các biểu cảm khuôn mặt và cử động môi khớp với lời nói một cách hoàn hảo.
Video thực tế về robot cho thấy khả năng mô phỏng tự nhiên nhiều ngôn ngữ và ngữ điệu khác nhau với những chuyển động môi chuẩn xác đến kinh ngạc. Đây được coi là bước tiến lớn giúp xóa bỏ cảm giác kỳ quái vốn thường xuất hiện khi con người tương tác với những cỗ máy có khuôn mặt vô hồn và cử động cứng nhắc.
Theo giáo sư Hod Lipson, Giám đốc phòng thí nghiệm máy móc sáng tạo của Columbia, rào cản lớn nhất ngăn cách robot và con người trong giao tiếp chính là sự thiếu hụt các chuyển động môi tự nhiên. Trong khi nhiều công ty như XPENG hay Neura tập trung vào khả năng vận động, khuôn mặt của robot vẫn mang đậm nét cơ khí.
Để giải quyết vấn đề này, nhóm nghiên cứu đã chế tạo một nguyên mẫu robot có khuôn mặt hoàn chỉnh với 26 mô tơ cơ mặt chuyên biệt. Thông qua mô hình ngôn ngữ thị giác sang hành động, robot tự học cách bắt chước cử động của con người bằng cách quan sát hình ảnh phản chiếu của chính mình và phân tích các cuộc hội thoại thực tế trên internet. Dù vẫn gặp đôi chút khó khăn với các âm khó như B hoặc W, kết quả đạt được đã vượt xa kỳ vọng của giới chuyên môn.
Trưởng nhóm nghiên cứu Yuhang Hu nhận định rằng khi khả năng đồng bộ môi này kết hợp với các trí tuệ nhân tạo hội thoại như ChatGPT hoặc Gemini, nó sẽ tạo ra một chiều sâu hoàn toàn mới trong kết nối giữa người và máy. Càng quan sát con người trò chuyện, robot càng trở nên tinh tế hơn trong việc mô phỏng các cử chỉ biểu cảm mà chúng ta có thể kết nối về mặt cảm xúc.
Giáo sư Hod Lipson tin rằng biểu cảm khuôn mặt đóng vai trò quan trọng ngang hàng với các kỹ năng cầm nắm hay di chuyển, đặc biệt là trong các lĩnh vực như giải trí, giáo dục, y tế và chăm sóc người cao tuổi. Ông dự báo rằng trong tương lai, mọi robot hình người đều sẽ cần một khuôn mặt biết cử động mắt và môi đúng cách để không mãi bị coi là những cỗ máy xa lạ.
Nghiên cứu này cho thấy một phương pháp mới đang được khai phá trong thị trường robot hình người đầy tiềm năng. Thay vì chỉ trình diễn những kỹ năng võ thuật hay khả năng bê vác vật nặng, các công ty sắp tới sẽ bắt đầu chế tạo những robot có vẻ ngoài và hành xử gần gũi với con người hơn.
Tuy nhiên, các nhà khoa học cũng lưu ý rằng thị trường cần thận trọng trong cách tiếp cận lĩnh vực này do còn nhiều tranh cãi xung quanh việc robot nên tương tác với con người như thế nào cho phù hợp với đạo đức và văn hóa. Sự thành công của mô hình tại Đại học Columbia không chỉ là thành tựu về kỹ thuật mà còn mở ra những câu hỏi quan trọng về tương lai của mối quan hệ giữa nhân loại và trí tuệ nhân tạo.












