Cha đẻ AI 'cãi lại' trào lưu của thế giới, xem mô hình ngôn ngữ lớn là ngõ cụt

Yann LeCun phát minh ra nhiều nền tảng cốt lõi của AI hiện đại. Song giờ đây, ông tin rằng hầu hết giới nghiên cứu đã bị cuốn theo 'tiếng gọi mê hoặc' của các mô hình ngôn ngữ lớn.

Khi còn là nghiên cứu sinh vào thập niên 1980, Yann LeCun kể rằng ông đã rất chật vật để tìm người hướng dẫn luận án tiến sĩ về học máy, vì chẳng ai nghiên cứu chủ đề này.

Học máy là lĩnh vực AI (trí tuệ nhân tạo), giúp máy tính học từ dữ liệu mà không cần lập trình trực tiếp cho từng nhiệm vụ.

Gần đây hơn, Yann LeCun trở thành người lạc lõng tại Meta Platforms. Dù được tôn vinh là một trong những “cha đẻ AI”, Yann LeCun ngày càng bị đứng ngoài lề khi hướng đi của công ty mẹ Facebook tách xa quan điểm của ông về tương lai AI.

Tuần qua, trang FT đưa tin Yann LeCun có thể rời Meta Platforms để lập công ty khởi nghiệp tập trung vào mô hình thế giới, công nghệ mà ông tin rằng sẽ thúc đẩy AI tiến xa hơn các mô hình ngôn ngữ mà Meta Platforms đang theo đuổi.

Mark Zuckerberg, Giám đốc điều hành Meta Platforms, đã đổ hàng chục tỉ USD vào mục tiêu tạo ra siêu trí tuệ, tuyển chọn đội ngũ hàng chục nghiên cứu AI hàng đầu từ các đối thủ nhằm giúp mô hình ngôn ngữ lớn Llama có thể vượt qua GPT của OpenAI và Google Gemini.

Bằng sự lựa chọn của riêng mình, Yann LeCun đi theo hướng khác. Ông tin rằng các mô hình ngôn ngữ lớn là ngõ cụt trong việc xây dựng máy tính có thể suy nghĩ vượt trội con người.

Nhà khoa học người Mỹ gốc Pháp 65 tuổi thích so sánh các mô hình AI hiện đại nhất hiện nay với bộ não của con mèo và tin rằng mèo còn thông minh hơn. Vài năm trước, ông rời vị trí quản lý FAIR (Phòng Nghiên cứu AI Cơ bản), bộ phận AI của Meta Platforms, để làm nhà nghiên cứu độc lập tập trung vào các dự án dài hạn.

“Tôi đã làm mất lòng không ít người ở Thung lũng Silicon, kể cả trong Meta, khi tuyên bố rằng chỉ trong ba đến năm năm nữa, mô hình thế giới chứ không phải mô hình ngôn ngữ lớn sẽ trở thành kiến trúc AI chủ đạo, và chẳng ai tỉnh táo mà còn dùng các mô hình ngôn ngữ lớn kiểu hiện nay”, Yann LeCun tại một hội thảo ở Viện Công nghệ Massachusetts (Mỹ) tháng trước.

Yann LeCun đã thảo luận với cộng sự về việc lập công ty khởi nghiệp xoay quanh mô hình thế giới, tuyển dụng đồng nghiệp và nói chuyện với nhà đầu tư, theo trang WSJ.

Mô hình thế giới học về thế giới xung quanh bằng cách tiếp nhận thông tin thị giác, giống con vật còn nhỏ hay đứa trẻ, trái ngược với mô hình ngôn ngữ lớn - dự đoán dựa trên kho dữ liệu văn bản khổng lồ.

Yann LeCun có tầm nhìn về AI khác với sếp của mình là Mark Zuckerberg - Ảnh: Getty Images

Yann LeCun có tầm nhìn về AI khác với sếp của mình là Mark Zuckerberg - Ảnh: Getty Images

Những bước tiến trong lĩnh vực mô hình thế giới

Các đội ngũ AI hàng đầu thế giới đang tăng cường tập trung vào mô hình thế giới có thể hiểu rõ hơn về môi trường sống của con người, trong nỗ lực tìm cách thức mới để đạt được siêu trí tuệ.

Google DeepMind, Meta Platforms và Nvidia đang cố gắng giành lợi thế trong cuộc đua AI bằng cách phát triển các hệ thống nhằm điều hướng thế giới vật chất thông qua việc học hỏi từ video và dữ liệu robot chứ không chỉ dựa vào ngôn ngữ.

Động thái này diễn ra trong bối cảnh những nghi vấn ngày càng tăng về việc liệu các mô hình ngôn ngữ lớn (công nghệ nền tảng cho chatbot phổ biến như ChatGPT của OpenAI hay Gemini) có đang chạm tới giới hạn phát triển hay không.

Các mô hình ngôn ngữ lớn của OpenAI, Google, xAI, Anthropic không còn những bước nhảy vọt về hiệu suất như trước, bất chấp số tiền khổng lồ đầu tư phát triển chúng.

Thị trường tiềm năng cho các mô hình thế giới có thể rất lớn, gần bằng quy mô nền kinh tế toàn cầu, vì mang công nghệ vào lĩnh vực vật lý, chẳng hạn ngành sản xuất và chăm sóc sức khỏe, theo Rev Lebaredian - Phó chủ tịch phụ trách Omniverse và công nghệ mô phỏng tại Nvidia.

Ông nói: “Cơ hội cho các mô hình nền tảng thế giới là gì? Về cơ bản là 100.000 tỉ USD nếu chúng ta có thể tạo ra trí thông minh hiểu và vận hành trong thế giới vật chất”.

Mô hình thế giới được đào tạo bằng cách sử dụng luồng dữ liệu của các môi trường thực hoặc mô phỏng. Theo giới chuyên gia, mô hình thế giới là bước tiến quan trọng trong việc thúc đẩy phát triển xe tự lái, robot và tác tử AI, nhưng đòi hỏi lượng lớn dữ liệu và sức mạnh điện toán để huấn luyện và là thách thức kỹ thuật chưa được giải quyết.

Sự tập trung vào hướng đi thay thế cho mô hình ngôn ngữ lớn đang trở nên rõ rệt, khi nhiều nhóm AI những tháng gần đây công bố hàng loạt bước tiến mới trong lĩnh vực mô hình thế giới.

Tháng 8, Google DeepMind đã giới thiệu bản xem trước Genie 3, mô hình tạo video từng khung hình và tính đến các tương tác trong quá khứ. Trước đây, các mô hình tạo video thường tạo ra toàn bộ video cùng lúc thay vì từng bước.

Shlomi Fruchter, đồng lãnh đạo Genie 3 tại Google DeepMind, cho biết: “AI vẫn còn rất hạn chế trong lĩnh vực kỹ thuật số. Bằng cách xây dựng những môi trường trông giống hoặc hành xử giống thế giới thực, chúng ta có thể tìm ra những cách huấn luyện AI có khả năng mở rộng hơn nhiều mà không phải gánh chịu hậu quả thực sự khi phạm sai lầm trong thế giới thật”.

Meta Platforms đang cố gắng mô phỏng cách trẻ em học một cách thụ động bằng cách quan sát thế giới xung quanh, huấn luyện các mô hình V-JEPA của mình trên nội dung video thô.

Phòng thí nghiệm FAIR thuộc Meta Platforms đã phát hành phiên bản thứ hai của mô hình V-JEPA vào tháng 6 và đang thử nghiệm nó trên robot.

Một ứng dụng gần trong tương lai của các mô hình thế giới là ở ngành giải trí, nơi chúng có thể tạo ra các cảnh tương tác và thực tế. World Labs, công ty khởi nghiệp được thành lập bởi bà Fei-Fei Li (nhà tiên phong về AI), đang phát triển mô hình tạo ra môi trường 3D giống trò chơi điện tử từ một hình ảnh duy nhất.

Runway, công ty khởi nghiệp tạo video AI có thỏa thuận với các studio Hollywood (gồm cả Lionsgate), vào tháng 8 đã ra mắt sản phẩm sử dụng mô hình thế giới để tạo bối cảnh trò chơi, với các câu chuyện và nhân vật cá nhân hóa được tạo ra trong thời gian thực.

Cristóbal Valenzuela, Giám đốc điều hành Runway, cho biết: “Các phương pháp video truyền thống là cách tiếp cận kiểu brute-force để tạo pixel, khi bạn cố gắng ép chuyển động vào vài khung hình để tạo ra ảo ảnh về chuyển động, nhưng mô hình không thực sự hiểu hoặc suy luận về những gì đang diễn ra trong cảnh đó”.

Trong ngữ cảnh AI, brute-force thường ám chỉ việc giải quyết một bài toán bằng cách dùng nhiều tài nguyên (điện toán, dữ liệu, thời gian) để “ép” ra kết quả, thay vì dựa trên mô hình hiểu biết hay suy luận về bản chất vấn đề.

Cristóbal Valenzuela nói thêm rằng các mô hình tạo video trước đây có các đặc điểm vật lý khác với thế giới thực, điều mà mô hình thế giới đa năng sẽ giúp giải quyết vấn đề. Song để xây dựng các mô hình này, các công ty cần thu thập một lượng lớn dữ liệu vật lý về thế giới.

Theo các chuyên gia AI, phạm vi ứng dụng của mô hình thế giới là vô cùng rộng lớn. Rev Lebaredian của Nvidia nhận định: “Mô hình thế giới có thể mang lại cơ hội ứng dụng cho hầu hết ngành công nghiệp, giống cách mà máy tính từng tạo ra bước nhảy vọt cho các công việc trí óc”.

Những đổi mới thuở ban đầu

Yann LeCun sinh tại thủ đô Paris, lớn lên ở ngoại ô và học tại trường ngày nay gọi là Đại học Sorbonne (Pháp) vào thập niên 1980. Trong thời gian học tiến sĩ, ông kết hôn với bà Isabelle và họ có người con đầu lòng trong tổng cộng ba cậu con trai.

Luôn đi trước thời đại, Yann LeCun nghiên cứu học máy trước khi công nghệ này trở nên thịnh hành. Yann LeCun làm việc tại phòng thí nghiệm AI của Geoffrey Hinton, người đoạt giải Nobel Vật lý 2024 vì công trình về học máy, ở thành phố Toronto (Canada) trước khi Hinton trở thành huyền thoại AI.

Yann LeCun dành phần lớn những năm đầu sự nghiệp tại Bell Labs ở bang New Jersey (Mỹ). Bell Labs là viện nghiên cứu nổi tiếng của Mỹ, từng thuộc hãng viễn thông AT&T và sau này là Nokia, nơi cho ra đời của hàng loạt phát minh mang tính cách mạng như transistor, ngôn ngữ lập trình C, UNIX, laser, thuyết thông tin và công nghệ thông tin hiện đại.

“Điều khiến tôi hào hứng nhất là được làm việc với những người thông minh hơn mình, vì điều đó khuếch đại khả năng của bạn”, Yann LeCun nói với tạp chí Wired năm 2023.

Tại Bell Labs, Yann LeCun góp phần phát triển công nghệ nhận dạng chữ viết tay được các ngân hàng dùng rộng rãi để đọc séc tự động. Ông cũng tham gia một dự án số hóa và phân phối tài liệu giấy qua internet.

Yann LeCun làm việc với nhiều nhà vật lý tại Bell Labs và đọc nhiều giáo trình vật lý.

“Tôi học được rất nhiều từ việc đọc những thứ tưởng như không liên quan đến AI hay khoa học máy tính. Tôi học đại học ngành kỹ thuật điện và việc được đào tạo chính quy về khoa học máy tính của tôi khá ít”, ông viết trong một buổi hỏi và đáp trên mạng xã hội Reddit 12 năm trước.

Năm 2003, Yann LeCun bắt đầu dạy khoa học máy tính tại Đại học New York (NYU), sau đó trở thành Giám đốc sáng lập Trung tâm Khoa học Dữ liệu của NYU.

Đến năm 2013, Mark Zuckerberg đích thân tuyển Yann LeCun về dẫn dắt bộ phận AI mới của Facebook (nay là Meta Platforms) khi đó. Yann LeCun điều hành phòng thí nghiệm trong 4 năm, rồi từ chức năm 2018 để trở thành nhà nghiên cứu độc lập và nhà khoa học trưởng về AI của Facebook.

Năm 2018, ông cùng Geoffrey Hinton và Yoshua Bengio giành giải Turing, giải thưởng cao quý nhất của ngành khoa học máy tính, vì những đóng góp nền tảng cho mạng nơ-ron, hệ thống đa lớp là nền tảng của nhiều công nghệ AI mạnh mẽ, từ chatbot đến xe tự lái.

Từ đó đến nay, Yann LeCun chủ yếu trở thành gương mặt đại diện của Meta Platforms. Ông không tham gia đội tạo ra Llama, mô hình ngôn ngữ lớn mã nguồn mở đầu tiên của Meta Platforms. Sau này, Yann LeCun cũng không dính dáng đến việc vận hành hay phát triển Llama hằng ngày.

Yann LeCun tự làm các dự án riêng và tham dự các hội nghị, nói về kính AI của Meta Platforms và quan điểm riêng về con đường dẫn đến sự tiến bộ của AI.

Léon Bottou, bạn thân lâu năm của Yann LeCun, từng nói với WSJ rằng ông “cứng đầu theo kiểu tốt”, tức là sẵn sàng lắng nghe quan điểm người khác nhưng luôn giữ niềm tin mạnh mẽ của riêng mình.

Tách lối

Hầu hết phát biểu gần đây từ Yann LeCun đều nhắm vào mô hình ngôn ngữ lớn - trọng tâm trong tham vọng của Mark Zuckerberg và gần như là mọi hãng công nghệ lớn.

“Chúng ta sẽ không đạt được AI ngang con người chỉ bằng cách mở rộng quy mô mô hình ngôn ngữ lớn. Không thể nào, hoàn toàn không thể. Dù bạn nghe những đồng nghiệp ưa mạo hiểm của tôi nói gì, điều đó sẽ không xảy ra trong hai năm tới”, ông nói trên podcast Big Technology của Alex Kantrowitz mùa xuân năm nay.

Trong một cuộc tái cấu trúc lớn mùa hè này, Mark Zuckerberg bổ nhiệm Alexandr Wang (28 tuổi, đồng sáng lập công ty gán nhãn dữ liệu Scale AI) làm Giám đốc AI tại Meta Platforms (sếp mới của Yann LeCun) và Shengjia Zhao (đồng sáng tạo ChatGPT) làm nhà khoa học trưởng.

Alexandr Wang hiện là Giám đốc AI tại Meta Platforms và là sếp mới của Yann LeCun - Ảnh: Getty Images

Alexandr Wang hiện là Giám đốc AI tại Meta Platforms và là sếp mới của Yann LeCun - Ảnh: Getty Images

Nhiều nhân viên trong bộ phận AI hơn 1.000 người của công ty bắt đầu hỏi nhau: Điều gì sẽ xảy ra với Yann LeCun?

Một số người xem đây là dấu hiệu Yann LeCun bị “gạt sang bên” vì không ủng hộ tầm nhìn AI của Mark Zuckerberg.

“Không có thay đổi gì trong vai trò của hiệu Yann LeCun. Ông ấy vẫn là nhà khoa học trưởng của FAIR”, Mark Zuckerberg viết trên mạng xã hội Threads vào tháng 7, nhắc đến bộ phận mà ông từng mời LeCun về để dẫn dắt hơn 10 năm trước. “Tôi mong được hợp tác với Shengjia Zhao”, Yann LeCun đáp lại trong phần bình luận.

Song vài tháng gần đây, bộ phận AI từng hưng thịnh của Yann LeCun bị cắt giảm nhân sự quy mô lớn, nhận ít nguồn lực hơn và giảm uy tín nội bộ, theo lời nhân viên cũ và hiện tại tại Meta Platforms.

Trong một thời gian dài, bộ phận do Yann LeCun đứng đầu được xem là nơi bàn luận về những ý tưởng lớn lao cho tương lai của AI, thử nghiệm đủ thứ có thể thành công hoặc thất bại, và không quá bận tâm chuyện đưa nghiên cứu vào sản phẩm thực tế.

Giờ đây, bộ phận nghiên cứu AI mới của Meta Platforms đầy những nhân tài được trả lương thưởng hàng triệu USD, do Alexandr Wang điều hành, đang thúc ép đội ngũ tạo ra những đột phá và biến thành sản phẩm thật nhanh.

Trong khi đó, Yann LeCun lại đi khắp châu Á và châu Âu, phát biểu tại các hội nghị. Trong một bài phát biểu đầu năm nay, ông đưa ra lời khuyên cho các nhà nghiên cứu đầy tham vọng: “Nếu bạn là nghiên cứu sinh tiến sĩ về AI, tuyệt đối đừng làm về mô hình ngôn ngữ lớn”.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/cha-de-ai-cai-lai-trao-luu-cua-the-gioi-xem-mo-hinh-ngon-ngu-lon-la-ngo-cut-241110.html