Logical Intelligence tạo đột phá hướng tới siêu AI, mời 'cha đẻ AI' vào ban lãnh đạo

Logical Intelligence vừa ra mắt mô hình suy luận dựa trên năng lượng, mang những dấu hiệu đáng tin cậy đầu tiên của AGI.

Công ty khởi nghiệp Logical Intelligence có trụ sở tại Thung lũng Silicon, mới thành lập được 6 tháng nhưng vừa tuyên bố đạt được đột phá trong việc phát triển mô hình AI (trí tuệ nhân tạo) tiên tiến hơn.

Cụ thể hơn, Logical Intelligence công bố mô hình suy luận “dựa trên năng lượng” mang tên Kona. Theo Logical Intelligence, Kona có thể giải quyết nhiều loại bài toán với độ chính xác cao hơn và tiêu thụ ít năng lượng hơn so với các mô hình ngôn ngữ lớn (công nghệ nền tảng cho chatbot AI) phổ biến như GPT của OpenAI hay Google Gemini.

Eve Bodnia, người sáng lập Logical Intelligence và là nhà vật lý lượng tử, nói với tờ FT rằng độ chính xác cao của hệ thống dựa trên nền tảng toán học này khiến Kona đặc biệt phù hợp với những lĩnh vực mà sai sót là không thể chấp nhận được, chẳng hạn sản xuất tiên tiến, robot và hạ tầng năng lượng.

Việc ra mắt Kona diễn ra khi Logical Intelligence chuẩn bị khởi động vòng gọi vốn vài tuần tới, với mục tiêu định giá từ 1 đến 2 tỉ USD, theo hai nguồn thạo tin.

Hôm 21.1, Logical Intelligence thông báo bổ nhiệm Yann LeCun làm chủ tịch hội đồng nghiên cứu kỹ thuật của mình. Có biệt danh “cha đẻ AI”, Yann LeCun từng là giám đốc khoa học AI của Meta Platforms, rời đi cuối năm ngoái để thành lập công ty khởi nghiệp Advanced Machine Intelligence Labs tập trung phát triển mô hình thế giới.

Yann LeCun sẽ giữ chức chủ tịch hội đồng nghiên cứu kỹ thuật của Logical Intelligence - Ảnh: Getty Images

Yann LeCun sẽ giữ chức chủ tịch hội đồng nghiên cứu kỹ thuật của Logical Intelligence - Ảnh: Getty Images

Động thái trên diễn ra khi một số đội ngũ AI hàng đầu thế giới, gồm cả Google DeepMind và Nvidia, đang tăng cường tập trung vào mô hình thế giới nhằm đạt tới siêu trí tuệ, trong bối cảnh lo ngại rằng các mô hình ngôn ngữ lớn đang dần chạm trần về tiến bộ.

“Những dấu hiệu đáng tin cậy đầu tiên của AGI”

Logical Intelligence là công ty khởi nghiệp đầu tiên tìm cách thương mại hóa mô hình AI dựa trên năng lượng (EBM). Tại buổi trình diễn hôm 21.1, Logical Intelligence cho thấy Kona đánh bại các mô hình ngôn ngữ lớn của OpenAI, Google và Anthropic khi giải câu đố Sudoku, đồng thời lên kế hoạch trình diễn các trò chơi cờ vua và cờ vây trong tương lai.

Giải câu đố Sudoku là quá trình điền các chữ số còn thiếu vào bảng ô vuông 9×9 sao cho thỏa mãn những quy tắc cơ bản của trò chơi: Mỗi hàng ngang phải chứa đủ các số từ 1 đến 9 mà không lặp lại, mỗi cột dọc cũng phải có đủ các số từ 1 đến 9 không trùng nhau và mỗi ô vuông nhỏ 3×3 bên trong bảng lớn cũng phải bao gồm đầy đủ các số từ 1 đến 9, mỗi số chỉ xuất hiện một lần. Người giải phải dựa vào logic và suy luận, không phải đoán mò, để xác định vị trí chính xác của từng con số dựa trên những dữ kiện ban đầu đã được cho sẵn.

Logical Intelligence cho biết khả năng suy luận của Kona dựa trên việc mô hình AI này có thể nhận diện và tự sửa lỗi trong một nhiệm vụ, rồi ngoại suy (mở rộng kết luận) sang các nhiệm vụ khác.

“Nếu trí tuệ tổng quát được hiểu là khả năng suy luận xuyên lĩnh vực, học hỏi từ sai lầm và cải thiện mà không cần huấn luyện lại cho từng nhiệm vụ, chúng tôi đang thấy ở Kona những dấu hiệu đáng tin cậy đầu tiên của AGI. Đây chưa phải trạng thái cuối cùng, nhưng là sự bứt phá rõ ràng khỏi AI hẹp”, bà Eve Bodnia nói.

AGI (AI tổng quát) được xem là siêu AI có khả năng hiểu, học hỏi và thực hiện các nhiệm vụ đa dạng một cách linh hoạt giống hay vượt trội con người.

Khác với mô hình ngôn ngữ lớn, vốn trả lời truy vấn bằng cách dự đoán từ tiếp theo có khả năng xuất hiện cao nhất trong một chuỗi, các mô hình dựa trên năng lượng được huấn luyện trên một tập tham số cố định, chẳng hạn luật chơi Sudoku, công suất lưới điện hay các ràng buộc vật lý của robot trong kho.

Càng đi chệch khỏi các quy tắc này, EBM càng tiêu tốn nhiều năng lượng hơn, qua đó ngăn ngừa tình trạng ảo giác (trả lời sai y như thật) thường thấy ở mô hình ngôn ngữ lớn. Các EBM đánh giá toàn bộ lời giải của mình dựa trên những tham số đã được thiết lập, trong đó câu trả lời có mức sử dụng năng lượng thấp nhất sẽ được chấm điểm cao nhất.

Eve Bodnia mô tả mô hình ngôn ngữ lớn như “một trò chơi đoán mò”. “Chúng ta nghĩ rằng vì đôi khi mô hình ngôn ngữ lớn cho ra đáp án đúng thì hẳn nó thông minh. Nhưng nếu bạn lấy một con mèo và dạy nó sủa, điều đó không có nghĩa nó là chó. Tôi đang tạo ra con chó”, bà ví von.

Eve Bodnia: Chúng tôi đang thấy ở Kona những dấu hiệu đáng tin cậy đầu tiên của AGI - Ảnh: X

Eve Bodnia: Chúng tôi đang thấy ở Kona những dấu hiệu đáng tin cậy đầu tiên của AGI - Ảnh: X

Yann LeCun từ lâu đã bác bỏ quan điểm cho rằng mô hình ngôn ngữ lớn có thể giúp đạt được AGI. Vì thế, “cha đẻ AI” hiện tập trung phát triển mô hình thế giới, được thiết kế để học cách tương tác với thế giới vật lý thông qua dữ liệu video và robot thay vì chỉ dựa vào ngôn ngữ.

“Logical Intelligence là công ty đầu tiên đưa suy luận dựa trên EBM từ một khái niệm nghiên cứu thành sản phẩm, mở ra một thế hệ hệ thống AI đáng tin cậy hơn”, Yann LeCun nhấn mạnh.

Ông và Eve Bodnia đều tin rằng AI đạt tới trình độ con người thực sự sẽ đến từ việc kết hợp nhiều loại mô hình.

“Con người có thể nhảy múa, ca hát và làm rất nhiều thứ không chỉ dựa trên ngôn ngữ. Do đó, để tồn tại và hành động hiệu quả trong thế giới thực thì cần phải kết hợp nhiều loại năng lực khác nhau: Phải biết nhận diện những nguy hiểm xung quanh và lựa chọn, tối ưu những kết quả hợp lý nhất có thể”, Eve Bodnia nói.

Những bước tiến của mô hình thế giới

Mô hình thế giới học về thế giới xung quanh bằng cách tiếp nhận thông tin thị giác, giống con vật còn nhỏ hay đứa trẻ, trái ngược với mô hình ngôn ngữ lớn - dự đoán dựa trên kho dữ liệu văn bản khổng lồ.

Nó được đào tạo bằng cách sử dụng luồng dữ liệu của các môi trường thực hoặc mô phỏng. Theo giới chuyên gia, mô hình thế giới là bước tiến quan trọng trong việc thúc đẩy phát triển xe tự lái, robot và tác tử AI, nhưng đòi hỏi lượng lớn dữ liệu và sức mạnh điện toán để huấn luyện và là thách thức kỹ thuật chưa được giải quyết.

Các công ty AI hàng đầu thế giới đã tăng cường tập trung vào mô hình thế giới có thể hiểu rõ hơn về môi trường sống của con người, trong nỗ lực tìm cách thức mới để đạt được siêu trí tuệ.

Google DeepMind, Meta Platforms và Nvidia đang cố gắng giành lợi thế trong cuộc đua AI bằng cách phát triển các hệ thống nhằm điều hướng thế giới vật chất thông qua việc học hỏi từ video và dữ liệu robot chứ không chỉ dựa vào ngôn ngữ. Sự tập trung vào hướng đi thay thế cho mô hình ngôn ngữ lớn đang trở nên rõ rệt, khi nhiều hãng gần đây công bố bước tiến mới trong lĩnh vực mô hình thế giới.

Tháng 8.2025, Google DeepMind đã giới thiệu bản xem trước Genie 3, mô hình tạo video từng khung hình và tính đến các tương tác trong quá khứ. Trước đây, các mô hình tạo video thường tạo ra toàn bộ video cùng lúc thay vì từng bước.

Shlomi Fruchter, đồng lãnh đạo Genie 3, cho biết: “AI vẫn còn rất hạn chế trong lĩnh vực kỹ thuật số. Bằng cách xây dựng những môi trường trông giống hoặc hành xử giống thế giới thực, chúng ta có thể tìm ra những cách huấn luyện AI có khả năng mở rộng hơn nhiều mà không phải gánh chịu hậu quả thực sự khi phạm sai lầm trong thế giới thật”.

Runway, công ty khởi nghiệp tạo video AI có thỏa thuận với các xưởng phim Hollywood (gồm cả Lionsgate), năm ngoái đã ra mắt sản phẩm sử dụng mô hình thế giới để tạo bối cảnh game, với các câu chuyện và nhân vật cá nhân hóa được tạo ra trong thời gian thực.

Cristóbal Valenzuela, Giám đốc điều hành Runway, nói rằng các mô hình tạo video hiện tại có các đặc điểm vật lý khác với thế giới thực, điều mà mô hình thế giới đa năng sẽ giúp giải quyết vấn đề. Song để xây dựng các mô hình này, các công ty cần thu thập một lượng lớn dữ liệu vật lý về thế giới.

Hãng Niantic (Mỹ) đã lập bản đồ 10 triệu địa điểm, thu thập thông tin thông qua các trò chơi, gồm cả Pokémon Go. Đây là game có hơn 30 triệu người chơi hàng tháng tương tác với bản đồ toàn cầu.

Cả Niantic Spatial và Nvidia đang làm việc để lấp đầy những khoảng trống bằng cách yêu cầu các mô hình thế giới của họ tạo ra hoặc dự đoán môi trường.

Nền tảng Omniverse của Nvidia tạo và vận hành những mô phỏng như vậy, hỗ trợ hãng chip AI số 1 thế giới trong việc thúc đẩy mảng robot và kế thừa lịch sử lâu dài mô phỏng thế giới thực trong game.

Meta Platforms đang cố gắng mô phỏng cách trẻ em học một cách thụ động bằng cách quan sát thế giới xung quanh, huấn luyện các mô hình V-JEPA của mình trên nội dung video thô.

Phòng thí nghiệm Facebook Artificial Intelligence Research (FAIR) thuộc Meta Platforms, từng do Yann LeCun lãnh đạo, đã phát hành phiên bản thứ hai của mô hình V-JEPA vào tháng 6.2025 và thử nghiệm nó trên robot.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/logical-intelligence-tao-dot-pha-huong-toi-sieu-ai-moi-cha-de-ai-vao-ban-lanh-dao-245063.html