'AI còn lâu mới thông minh như con người vì phải học hỏi nhiều điều'
Trí tuệ nhân tạo (AI) là chủ đề chính được thảo luận ở Diễn đàn Kinh tế Thế giới 2024 diễn ra tại thị trấn Davos (Thụy Sĩ), nhưng một số chuyên gia đã đưa ra thông điệp khá nghiêm túc cho mọi người: AI vẫn còn chặng đường dài phía trước để trở nên thông minh thực sự.
Thật dễ hiểu tại sao AI lại đứng đầu trong chương trình nghị sự tại Diễn đàn Kinh tế Thế giới 2024. Xét cho cùng, AI đang ở giữa một chu kỳ cường điệu khiến Web3 phải lu mờ.
Trong một năm kể từ khi các nhà lãnh đạo thế giới tham dự Diễn đàn Kinh tế Thế giới lần trước, những gã khổng lồ công nghệ như Google và Microsoft đã chạy đua để theo kịp ChatGPT của OpenAI, còn Bill Gates tung hô những khả năng thay đổi thế giới của công nghệ này.
Song bất chấp mọi sự cường điệu, các chuyên gia AI trong tuần qua vẫn khẳng định rằng AI ở dạng hiện tại có phạm vi khá hạn chế, đặc biệt nếu mục tiêu cuối cùng của lĩnh vực này là tạo ra trí tuệ nhân tạo tổng hợp (AGI). AGI là một AI siêu thông minh, tiên tiến đến mức có thể làm được nhiều việc ngang bằng hoặc tốt hơn con người. AGI cũng có thể tự cải thiện, tạo ra một vòng phản hồi vô tận với khả năng vô hạn.
Dưới đây là lý do tại sao.
AI chỉ mới chạm đến bề mặt
Trong cuộc thảo luận về AI tạo sinh (generative AI) tuần qua, các chuyên gia lần đầu tiên chỉ ra những thách thức về dữ liệu cần phải vượt qua để làm cho AI ngày nay thông minh hơn rất nhiều.
Daphne Koller, nhà khoa học máy tính đoạt giải Thiên tài MacArthur, nói tại cuộc hội thảo rằng "chúng ta chỉ mới bắt đầu chạm vào bề mặt của dữ liệu có sẵn".
Phần lớn các mô hình AI phổ biến nhất hiện nay, chẳng hạn như GPT-4 của OpenAI, đều được đào tạo về những gì có sẵn công khai trên internet. Loại dữ liệu mà bà Daphne Koller muốn AI xử lý còn vượt xa hơn thế.
Thứ nhất, có một thế giới dữ liệu khổng lồ đến từ "AI được cụ thể hóa" (embodied AI). Đây là loại AI được nhúng vào các tác nhân, chẳng hạn robot, có thể tương tác với môi trường vật lý. Các chatbot AI hiện nay thực sự không nhận được nhiều loại dữ liệu này.
Hiện có những trường hợp cụ thể, trong đó AI tương tác với loại môi trường này để thu thập dữ liệu. Hãy xem cách ô tô tự lái thu thập và phân tích dữ liệu về giao thông đường bộ hoặc cách AI được sử dụng để phát hiện sớm dấu hiệu của bệnh võng mạc.
Một vấn đề là mô hình AI đa năng có thể phân tích và xử lý tất cả dữ liệu này hiện vẫn chưa tồn tại trên thực tế.
Dữ liệu đến từ thử nghiệm cũng bị thiếu. Như Daphne Koller đã lưu ý, khả năng “trải nghiệm với thế giới này” là một phần khiến con người học tập hiệu quả. Bằng cách so sánh, khả năng của AI để làm điều này hiện còn thiếu.
Một giải pháp cho vấn đề dữ liệu này là tạo cơ hội cho máy móc tạo ra dữ liệu tổng hợp của riêng chúng, thay vì chỉ dựa vào dữ liệu do con người tạo ra được cung cấp từ web.
“Nếu muốn những cỗ máy này phát triển, chúng ta cần cho chúng khả năng không chỉ 'nói chuyện' với nhau trong môi trường ảo mà còn thực sự trải nghiệm với thế giới và tạo ra loại dữ liệu giúp chúng tiếp tục phát triển”, Daphne Koller nói.
Vấn đề kiến trúc
Các vấn đề khác mà các chuyên gia chỉ ra đều xoay quanh kiến trúc.
Với Yann LeCun, Giám đốc khoa học AI tại Meta Platforms, rõ ràng là các mô hình ngôn ngữ lớn tự hồi quy (LLM), nền tảng cho chatbot AI ngày nay, đang cần “một số kiến trúc mới” để đạt đến cấp độ thông minh tiếp theo.
Hiện tại, các mô hình AI như LLM hoạt động bằng cách lấy một đoạn văn bản, chẳng hạn như chỉnh sửa nội dung bằng cách xóa các từ, sau đó xây dựng lại toàn bộ văn bản. Yann LeCun lưu ý rằng LLM làm điều này khá tốt với văn bản, nhưng không thể thực hiện với hình ảnh hoặc video.
Yann LeCun, người được mệnh danh là “cha đẻ AI”, cho biết: “Tôi chụp một hình ảnh bị hỏng do loại bỏ một số phần, sau đó huấn luyện một số mạng nơ-ron lớn để khôi phục lại hình ảnh. Điều đó không hiệu quả hoặc hoạt động không tốt lắm”.
Điều đáng chú ý là các mô hình AI ngày nay khá hiệu quả trong việc tạo ra hình ảnh, nhưng đây là những mô hình chuyển văn bản thành ảnh, như Midjourney và Stable Diffusion. OpenAI cũng có mô hình AI tương tự mang tên DALL-E để chuyển văn bản thành hình ảnh, tách biệt với GPT-4.
Với Yann LeCun, con đường hướng tới một mô hình AI có thể làm được tất cả điều đó có thể không nằm ở thứ mà mọi người đang bị ám ảnh.
“Hiện vẫn chưa có giải pháp thực sự, nhưng những mô hình AI hứa hẹn nhất hiện tại, ít nhất là những thứ có tác dụng nhận dạng hình ảnh, đều không phải là tạo sinh”, ông nói.
Daphne Koller cũng nhận thấy các vấn đề với LLM ngày nay. Theo quan điểm của bà, các phiên bản hiện nay của những mô hình AI này không tốt lắm trong việc hiểu logic nhận thức cơ bản, như nguyên nhân và kết quả. Daphne Koller nói: “Chúng hoàn toàn là công cụ dự đoán, chỉ đang tạo ra các liên kết”.
Đây không phải là lần đầu tiên có người đặt ra nghi ngờ về năng lực của các mô hình AI ngày nay.
Một bài báo do bộ ba nhà nghiên cứu của Google gửi tới trang ArXiv vào tháng 11.2023 đã phát hiện ra rằng công nghệ Transformer, nền tảng của các LLM, không giỏi tổng hợp kiến thức vượt ra ngoài tập dữ liệu hiện có. Nếu mục tiêu lớn là AGI thì điều này không mấy hứa hẹn.
Song, điều đó không có nghĩa là LLM ngày nay là vô dụng. Kai-Fu Lee, nhà khoa học máy tính sáng lập công ty khởi nghiệp 01.AI và cựu Chủ tịch Google Trung Quốc, đã nói về “giá trị thương mại đáng kinh ngạc” của LLM. Công ty khởi nghiệp 01.AI của ông đạt được mức định giá 1 tỉ USD chưa đầy 8 tháng sau khi ra mắt.
Kai-Fu Lee nói: “LLM giải quyết các vấn đề thực tế, có thể tạo ra nội dung, cải thiện đáng kể năng suất của chúng ta và đang được triển khai ở khắp mọi nơi”.
Tuy nhiên, liệu LLM có sắp tạo ra được những cỗ máy thông minh như con người không? Ít nhất trong hình thức hiện tại thì câu trả lời là không.
“
Web3 là khái niệm trong ngữ cảnh của sự phát triển của internet và các công nghệ liên quan, thường được liên kết với các xu hướng và thay đổi trong cách chúng ta tương tác với mạng cùng dữ liệu trực tuyến.
Web3 được xem phiên bản kế tiếp của internet, bước tiến sau Web 1.0 (trang web tĩnh) và Web 2.0 (nền tảng tương tác và xã hội). Nó đề xuất một mô hình mới cho internet, nơi người dùng có quyền kiểm soát lớn hơn về dữ liệu cá nhân và trải nghiệm trực tuyến của họ.
Một đặc điểm chính của Web3 là mô hình phi tập trung. Thay vì dựa vào các tổ chức tập trung để quản lý và kiểm soát dữ liệu, Web3 thúc đẩy sự phi tập trung thông qua việc sử dụng công nghệ blockchain và các giao thức liên quan.
Công nghệ blockchain, đặc biệt là các hợp đồng thông minh, đóng vai trò quan trọng trong Web3. Các hợp đồng thông minh là các chương trình tự thực hiện được được lưu trữ và chạy trên blockchain, giúp đơn giản hóa quy trình giao dịch và tăng tính minh bạch.
Web3 được tạo ra với mục tiêu chính là truyền quyền lực trực tiếp cho người sử dụng. Thay vì các công ty lớn kiểm soát dữ liệu và thông tin người dùng, Web3 cung cấp các công cụ để người dùng có thể kiểm soát và quản lý thông tin cá nhân của họ.
Web3 thúc đẩy các ứng dụng và dịch vụ mà không cần sự can thiệp của bên thứ ba, như ngân hàng hay tổ chức trung gian. Các ứng dụng phi tập trung có thể được xây dựng dựa trên các giao thức blockchain, mang lại tính minh bạch và an toàn.
Tóm lại, Web3 là một tầm nhìn về sự phát triển của internet, nơi quyền lực được chuyển giao từ các tổ chức trung ương đến cộng đồng và người dùng cá nhân, thường thông qua việc sử dụng blockchain và các công nghệ liên quan.