Phát triển hệ thống AI có khả năng chuyển suy nghĩ thành văn bản
Một bộ giải mã ngữ nghĩa có khả năng phân tích và chuyển những ý nghĩ trong não bộ con người thành văn bản vừa được các nhà khoa học phát triển, mở ra cơ hội cho những người mất khả năng giao tiếp vật lý sau khi mắc đột quỵ, bại liệt hoặc các bệnh thoái hóa khác.
Mới đây, các nhà khoa học tại Đại học Texas (Mỹ) đã phát triển một hệ thống trí tuệ nhân tạo (AI) không xâm lấn tập trung vào việc “dịch” hoạt động não bộ con người thành một luồng văn bản.
Theo nghiên cứu đã được bình duyệt và xuất bản trên tạp chí Nature Neuroscience ngày 1/5 vừa qua, hệ thống AI này được gọi là bộ giải mã ngữ nghĩa, và mục tiêu mà nó hướng đến là đem lại lợi ích cho những người bệnh mất khả năng giao tiếp vật lý.
Trong quá trình phát triển hệ thống, các nhà khoa học đã sử dụng mô hình học sâu Transformer, vốn được dùng chủ yếu ở lĩnh vực xử lý ngôn ngữ tự nhiên và thị giác máy tính, tương tự những mô hình đứng đằng sau các chatbot AI như Bard của Google hay ChatGPT của OpenAI.
Để đào tạo bộ giải mã, các tình nguyện viên tham gia nghiên cứu phải nằm nhiều giờ nghe podcast trong máy quét cộng hưởng từ chức năng (fMRI), thường được sử dụng để đo hoạt động của não bộ. Hệ thống AI này không yêu cầu bất kỳ phẫu thuật cấy ghép nào.
Sau khi được đào tạo, hệ thống có thể tạo ra một luồng văn bản khi tình nguyện viên đang nghe hoặc tưởng tượng về kể một câu chuyện mới. Văn bản thu được không phải là một bản chép lại chính xác, mà các nhà nghiên cứu đã thiết kế nó với mục đích ghi lại những suy nghĩ hoặc ý tưởng tổng thể.
Theo một thông cáo báo chí, hệ thống AI của nhóm nghiên cứu đã tạo ra văn bản sát hoặc chính xác với ý nghĩa dự định của các từ gốc của tình nguyện viên chỉ trong khoảng một nửa thời gian.
Chẳng hạn, khi một người tham gia nghe thấy những từ “Tôi chưa có bằng lái xe” trong một cuộc thử nghiệm, thì những suy nghĩ này được hệ thống chuyển thành đoạn văn bản: “Cô ấy thậm chí còn chưa bắt đầu học lái xe”.
Các tình nguyện viên cũng được yêu cầu xem 4 video không có âm thanh ở trong máy quét fRMI và hệ thống AI có thể mô tả chính xác một số sự kiện từ những video đó.
“Đối với một phương pháp không xâm lấn, đây là một bước tiến thực sự so với những gì đã được thực hiện trước đây, vốn thường là những từ đơn hoặc câu ngắn. Chúng tôi đang có được mô hình giải mã ngôn ngữ liên tục trong thời gian dài với những ý tưởng phức tạp”, ông Alexander Huth, một trong những người dẫn đầu nhóm nghiên cứu, chia sẻ.
Bộ giải mã ngữ nghĩa hiện không khả dụng ngoài môi trường phòng thí nghiệm vì nó phụ thuộc vào máy quét fMRI. Nhưng các nhà khoa học tin rằng, trong tương lai hệ thống AI này cuối cùng sẽ sử dụng được thông qua các hệ thống “dịch” hoạt động của não bộ di động hơn.
Nhóm nghiên cứu cho biết đã nộp hồ sơ xin cấp bằng sáng chế theo Hiệp ước Hợp tác sáng chế (PCT) cho công trình này.