Chuyển hình ảnh trong não thành văn bản

6 giờ trướcGốc

Một nhóm nghiên cứu tại Nhật Bản vừa công bố kỹ thuật mới cho phép máy tính tạo ra câu mô tả từ chính những hình ảnh mà con người đang quan sát hoặc hình dung trong não. Công nghệ này kết hợp dữ liệu quét não với trí tuệ nhân tạo (AI) để chuyển các tín hiệu thị giác thành văn bản một cách rõ ràng và dễ hiểu.

Ảnh chụp cộng hưởng từ chức năng cho thấy các lát cắt ngang của não.

Nghiên cứu do Nghiên cứu viên cao cấp Tomoyasu Horikawa tại Phòng thí nghiệm Khoa học Truyền thông NTT (Nhật Bản) thực hiện, đăng trên tạp chí Science Advances. Ông cho biết, việc dịch suy nghĩ thành chữ đã có tiến bộ, nhưng việc diễn giải hình ảnh phức tạp trong trí óc thành câu mô tả vẫn là thách thức lớn.

Trong nghiên cứu, Horikawa dùng phương pháp fMRI, chụp cộng hưởng từ chức năng, một kỹ thuật quét não không xâm lấn, để ghi lại hoạt động não của sáu người tham gia trong độ tuổi 22-37. Những người này xem 2.180 đoạn video ngắn không âm thanh, với nội dung đa dạng như vật thể, khung cảnh hay hành động.

Phần mô tả bằng lời của từng video được đưa vào một hệ thống AI ngôn ngữ. Hệ thống sẽ chuyển mô tả này thành các chuỗi số. Sau đó, Horikawa huấn luyện một mô hình AI khác gọi là bộ giải mã để nối hoạt động não thu được từ fMRI với những chuỗi số này.

Khi người tham gia xem hoặc nhớ lại các video mà hệ thống chưa từng được huấn luyện trước, bộ giải mã sẽ chuyển tín hiệu não thành dữ liệu và một thuật toán tiếp tục tạo ra câu văn phù hợp nhất với hoạt động não đó. Qua thời gian, hệ thống ngày càng mô tả chính xác hơn nội dung các video mà người tham gia đã xem.

Điều đáng chú ý là mô tả được tạo ra bằng tiếng Anh, dù người tham gia đều là người Nhật. Theo Horikawa, hệ thống không cần sử dụng đến vùng xử lý ngôn ngữ trong não, nên có thể hỗ trợ cả người bị tổn thương vùng ngôn ngữ, ví dụ người bị mất ngôn ngữ sau đột quỵ hoặc người mắc bệnh thần kinh vận động.

Các chuyên gia đánh giá đây là bước tiến quan trọng trong hướng tiếp cận đọc hiểu hoạt động não. Tuy nhiên, họ cũng cảnh báo nguy cơ lớn về quyền riêng tư. Việc giải mã nội dung trong đầu người khi chưa được nói ra có thể dẫn đến nhiều hệ lụy nếu bị lạm dụng. Các tổ chức về quyền não bộ cho rằng dữ liệu thần kinh cần được xem là siêu nhạy cảm, chỉ được dùng khi có sự đồng ý rõ ràng và phải có cơ chế bảo mật nghiêm ngặt.

Horikawa nhấn mạnh, công nghệ hiện tại vẫn còn xa mới đạt mức đọc suy nghĩ thực sự. Hệ thống cần lượng lớn dữ liệu từ từng cá nhân và còn hạn chế khi gặp những hình ảnh bất thường hoặc hiếm gặp.

Tuệ An

Trí tuệ nhân tạo

Nguồn Đại Đoàn Kết: https://daidoanket.vn/chuyen-hinh-anh-trong-nao-thanh-van-ban.html