Mỹ phát triển hệ thống AI không xâm lấn 'dịch' suy nghĩ thành văn bản
Các nhà khoa học tại Đại học Texas (Austin, Mỹ) đã phát triển một bộ giải mã ngôn ngữ ứng dụng trí tuệ nhân tạo (AI) giúp chuyển đổi hoạt động của não thành một dòng văn bản liên tục.
Thu thập dữ liệu hoạt động của não, biến suy nghĩ thành văn bản
Bộ giải mã suy nghĩ này là một hệ thống AI không xâm lấn, không cần phẫu thuật cấy ghép, dựa trên mô hình máy biến áp tương tự như mô hình cung cấp năng lượng cho ChatGPT của Open AI và Bard của Google.
Công nghệ này cung cấp phương tiện giao tiếp mới, hỗ trợ hiệu quả những người có ý thức về mặt tinh thần nhưng không thể nói được, ví dụ như những người bị đột quỵ.
Nghiên cứu mới được công bố trên tạp chí Nature chuyên ngành khoa học thần kinh. Nhóm các nhà khoa học từ Đại học Texas (Austin, Mỹ) đã đưa dữ liệu hoạt động của não người thu thập được vào một mô hình ngôn ngữ mạng thần kinh. Sau đó, bộ giải mã sẽ dự đoán cách não bộ của con người phản ứng với lời nói, thu hẹp các tùy chọn cho đến khi tìm được phản hồi phù hợp nhất.
Cụ thể, những người tham gia sẽ dành khoảng 15 giờ liên tục nằm trong máy fMRI (máy chụp cộng hưởng từ chức năng đo hoạt động của não bộ) và tập trung nghe podcast (những tệp tin dạng âm thanh). Bộ giải mã sẽ "dịch" hoạt động của não bộ thành dòng văn bản liên tục khi người đó lắng nghe, tưởng tượng những câu chuyện.
Bộ giải mã có thể tái tạo chính xác một số từ và cụm từ, đồng thời nắm bắt ý chính của nhiều từ và cụm từ khác. Ví dụ, trong các thử nghiệm, một người tham gia nghe một cô gái nói: "Tôi chưa có bằng lái xe" thì suy nghĩ của họ được dịch thành: "Cô ấy thậm chí còn chưa bắt đầu học lái xe".
Trong thời gian tới, các nhà nghiên cứu sẽ tiếp tục phát triển, "đào tạo" bộ giải mã để tăng độ chính xác, tạo ra văn bản khớp chặt chẽ với suy nghĩ gốc của những người sử dụng.
Công nghệ mới có thể đọc suy nghĩ của tất cả mọi người?
Phó giáo sư Alex Huth (chuyên ngành khoa học thần kinh và khoa học máy tính tại Đại học Texas) cho biết: "Đối với một phương pháp không xâm lấn, đây là một bước tiến thực sự so với những gì đã được thực hiện trước đây - thường là những từ đơn lẻ hoặc câu ngắn. Chúng tôi phát triển mô hình giải mã ngôn ngữ liên tục trong thời gian dài với những ý tưởng phức tạp."
Tuy nhiên, điều kiện để hệ thống này hoạt động hiệu quả là người tham gia sẵn sàng hợp tác và cho phép giải mã suy nghĩ của họ. Những người không được đào tạo với máy fMRI hoặc đã tham gia nhưng phản kháng bằng cách nghĩ về những vấn đề khác, bộ giải mã đều không thể hiểu được.
Bên cạnh đó, hệ thống này cũng đòi hỏi cơ sở trang thiết bị đặc thù, tốn kém chi phí nên khả năng sử dụng rộng rãi hiện vẫn hạn chế.
Vì vậy, theo Phó giáo sư Alex Huth, những trường hợp thẩm vấn các tù nhân chính trị, người sử dụng lao động theo dõi nhân viên đều không khả thi với bộ giải mã này.
Đối với lo ngại công nghệ sẽ bị lạm dụng vào mục đích xấu, trưởng nhóm Jerry Tang - nghiên cứu sinh về khoa học máy tính tại Đại học Texas cho biết: "Chúng tôi luôn nỗ lực để tránh điều đó. Chúng tôi muốn đảm bảo rằng mọi người chỉ sử dụng những loại công nghệ này khi họ muốn và nó giúp ích cho họ."
Theo ông Tang, hiện tại, công nghệ này vẫn đang ở giai đoạn sơ khai. Hệ thống này hiện không thực tế để sử dụng bên ngoài phòng thí nghiệm vì nó phụ thuộc vào máy fMRI. Tuy nhiên, việc chủ động ban hành các chính sách bảo vệ quyền riêng tư của những người dùng cũng như quy định phạm vi sử dụng của thiết bị này là rất quan trọng.