Ông trùm AI tại Meta: Châu Âu nên giữ mô hình mã nguồn mở như DeepSeek hoặc có nguy cơ bị tụt hậu
Châu Âu nên giữ các mô hình trí tuệ nhân tạo (AI) mã nguồn mở hoặc có nguy cơ bị tụt lại phía sau, theo lời Yann LeCun - Giám đốc khoa học AI của Meta Platforms.
Được mệnh danh là "cha đẻ AI", Yann LeCun từng giành giải thưởng chính VinFuture 2024 trị giá 3 triệu USD cùng 4 nhà khoa học khác, gồm giáo sư Yoshua Bengio (Canada), giáo sư Geoffrey E. Hinton (Canada), Jensen Huang - Giám đốc điều hành kiêm Chủ tịch Nvidia (Mỹ) và giáo sư Fei-Fei Li (Mỹ) vì những đóng góp đột phá để thúc đẩy sự tiến bộ của học sâu.
Yann LeCun cho biết châu Âu và một số quốc gia đang cố gắng làm cho các mô hình AI mã nguồn mở trở thành bất hợp pháp vì muốn duy trì lợi thế trước các đối thủ chính trị, điều mà ông gọi là "sai lầm nghiêm trọng".
Ông đã đưa ra nhận xét này trong bài thuyết trình tại Hội nghị thượng đỉnh Hành động AI ở Paris (thủ đô Pháp) hôm 11.2.
"Khi nghiên cứu trong bí mật, bạn sẽ bị tụt lại phía sau. Phần còn lại của thế giới sẽ đi theo hướng mã nguồn mở và vượt qua bạn. Điều đó đang diễn ra ngay lúc này", Yann LeCun nói.
Các mô hình AI mã nguồn mở cho phép chia sẻ phần mềm miễn phí và công khai cho bất kỳ ai với bất kỳ mục đích nào.
Yann LeCun từ lâu đã ủng hộ các mô hình ngôn ngữ lớn mã nguồn mở và nhấn mạnh rằng những hệ thống này không nên bị kiểm soát bởi một số ít người hoặc công ty. Ông cho rằng một mô hình mã nguồn mở giúp nhiều người hưởng lợi vì tốc độ phát triển nhanh hơn.
"Chúng ta không thể để những hệ thống này chỉ đến từ một số ít công ty ở bờ Tây nước Mỹ hoặc Trung Quốc", Yann LeCun nhấn mạnh.
Nhận xét của ông được đưa ra sau khi DeepSeek, công ty khởi nghiệp AI Trung Quốc, cuối tháng 1 ra mắt mô hình suy luận R1 mạnh mẽ với chi phí đào tạo thấp, khiến các hãng công nghệ và AI Mỹ lo ngại. Các bài kiểm tra từ bên thứ ba cho thấy R1 có hiệu suất tương đương hoặc vượt sản phẩm từ OpenAI, Meta Platforms và những nhà phát triển hàng đầu khác, đồng thời DeepSeek tuyên bố xây dựng nó với chi phí thấp hơn.
Mô hình R1 là mã nguồn mở, cho phép những người khác tải xuống và xây dựng trên nền tảng đó.
"DeepSeek đã hưởng lợi từ nghiên cứu và mã nguồn mở, chẳng hạn thư viện PyTorch và mô hình Llama từ Meta. Họ đã đưa ra những ý tưởng mới và phát triển dựa trên công trình của người khác. Vì công trình của DeepSeek được công bố là nguồn mở nên mọi người đều có thể hưởng lợi từ nó. Đó là sức mạnh của nghiên cứu mở và nguồn mở", Yann LeCun viết trong một bài đăng trên mạng xã hội Threads.
PyTorch là thư viện mã nguồn mở về học máy, được phát triển bởi Meta Platforms. PyTorch được sử dụng rộng rãi trong lĩnh vực AI và học sâu nhờ tính linh hoạt, dễ sử dụng và khả năng tính toán mạnh mẽ trên cả CPU (bộ xử lý trung tâm) và GPU (bộ xử lý đồ họa).
PyTorch dùng để làm gì?
- Thị giác máy tính: Nhận diện hình ảnh, phân loại ảnh, xử lý ảnh y tế, xe tự hành...
- Xử lý ngôn ngữ tự nhiên: Dịch máy, chatbot, tóm tắt văn bản, mô hình ngôn ngữ (GPT, BERT)...
- AI trong game và robot: Học tăng cường, điều khiển robot, AI chơi game...
- Ứng dụng khoa học dữ liệu & tài chính: Dự đoán thị trường chứng khoán, phân tích dữ liệu lớn...
Các mô hình Llama của Meta Platforms chủ yếu là mã nguồn mở, điều mà Yann LeCun luôn ủng hộ trong công ty. OpenAI ban đầu được thành lập như một công ty AI mã nguồn mở, nhưng gần đây đã chuyển sang mô hình mã nguồn đóng.
![Yann LeCun khuyên châu Âu nên giữ các mô hình AI mã nguồn mở hoặc có nguy cơ bị tụt lại phía sau - Ảnh: Getty Images](https://photo-baomoi.bmcdn.me/w700_r1/2025_02_11_287_51450246/8f4512ff27b1ceef97a0.jpg)
Yann LeCun khuyên châu Âu nên giữ các mô hình AI mã nguồn mở hoặc có nguy cơ bị tụt lại phía sau - Ảnh: Getty Images
Các công ty AI châu Âu đang sử dụng mô hình AI mã nguồn mở có Mistral (Pháp) và Aleph Alpha (Đức). Cả hai công ty này đã chỉ trích đề xuất của châu Âu nhằm điều chỉnh các nhà phát triển mô hình nền tảng. Các nhà làm luật ở Pháp, Đức và Ý đã thúc đẩy một framework (khung làm việc) cho phép nhà phát triển mô hình AI tự điều chỉnh để có thể cạnh tranh với các tập đoàn công nghệ Mỹ.
Framework là bộ công cụ hoặc nền tảng được thiết kế để hỗ trợ các lập trình viên phát triển phần mềm nhanh chóng và hiệu quả hơn. Nó cung cấp sẵn cấu trúc, thư viện, hàm và quy tắc lập trình, giúp giảm bớt công sức viết mã từ đầu.
Đạo luật AI của Liên minh châu Âu, được thông qua vào năm 2024, nhằm giải quyết rủi ro liên quan đến công nghệ AI mạnh mẽ. Gần đây, đã có nhiều tranh luận về cách điều chỉnh các mô hình nền tảng, chẳng hạn mô hình ngôn ngữ lớn, theo đạo luật này.
"Bài học lớn nhất từ thành công của DeepSeek"
Với Yann LeCun, bài học lớn nhất rút ra từ thành công của DeepSeek không phải mối đe dọa gia tăng do sự cạnh tranh từ Trung Quốc gây ra, mà là giá trị của việc giữ cho các mô hình AI ở dạng nguồn mở để bất kỳ ai cũng có thể hưởng lợi.
"Không phải là AI của Trung Quốc đang vượt qua Mỹ mà là các mô hình nguồn mở đang vượt qua các mô hình độc quyền", Yann LeCun viết trong một bài đăng trên mạng xã hội Threads.
Khi giới thiệu R1 vào ngày 20.1 với lời quảng cáo nó "thể hiện khả năng suy luận đáng kinh ngạc", DeepSeek tuyên bố đang "mở rộng ranh giới" của AI nguồn mở.
Thông báo này đã khiến Thung lũng Silicon bất ngờ và trở thành sự kiện được bàn tán nhiều của ngành công nghệ vào một tuần có Diễn đàn Kinh tế thế giới ở thị trấn Davos (Thụy Sĩ), bất ổn liên quan đến TikTok và những ngày đầu bận rộn của Tổng thống Mỹ Donald Trump với nhiệm kỳ thứ hai.
Vài ngày sau thông báo của DeepSeek, Giám đốc điều hành Meta Platforms - Mark Zuckerberg cho biết công ty có kế hoạch chi từ 60 đến 65 tỉ USD vào năm 2025 để tăng cường đầu tư vào AI. Mark Zuckerberg là người ủng hộ mạnh mẽ các mô hình nguồn mở.
"Một phần mục tiêu của tôi trong 10-15 năm tới là xây dựng thế hệ nền tảng mở tiếp theo và để các nền tảng mở giành chiến thắng. Tôi nghĩ rằng điều đó sẽ dẫn đến một ngành công nghiệp công nghệ sôi động hơn nhiều", tỷ phú 40 tuổi người Mỹ nói hồi tháng 9.2024.
Những người ủng hộ nói rằng mã nguồn mở cho phép công nghệ phát triển nhanh chóng và dân chủ hơn vì bất kỳ ai cũng có thể sửa đổi và phân phối lại mã. Trong khi những người ủng hộ các mô hình mã nguồn đóng cho rằng chúng an toàn hơn vì mã được giữ riêng tư.
Sam Altman, Giám đốc điều hành OpenAI, nói phương pháp tiếp cận mã nguồn đóng cung cấp cho công ty của ông "một cách dễ dàng hơn để đạt đến ngưỡng an toàn" trong một phiên Ask Me Anything (Hỏi tôi bất cứ điều gì) trên mạng xã hội Reddit vào tháng 11.2024. Tuy nhiên, doanh nhân 39 tuổi người Mỹ nói thêm rằng ông "muốn OpenAI mở mã nguồn nhiều thứ hơn trong tương lai".
Khi đối thủ áp dụng một cách tiếp cận khác và thành công, đôi khi việc thay đổi hướng đi là điều nên làm. Đó là những gì Sam Altman nói rằng OpenAI sẽ thực hiện, theo một phiên hỏi đáp trên Reddit hôm 1.1.
Cuộc thảo luận đề cập đến nhiều chủ đề liên quan đến AI, nhưng Sam Altman được hỏi nhiều nhất về DeepSeek.
Một người dùng Reddit đã hỏi liệu OpenAI có thể hiển thị “tất cả token suy nghĩ” hay không. Điều này đề cập đến chuỗi suy luận mà các mô hình AI mới sử dụng để chia nhỏ nhiệm vụ thành những bước nhỏ hơn, tương tự cách con người suy nghĩ khi giải quyết vấn đề phức tạp.
Mô hình o1 và o3 của OpenAI sử dụng phương pháp suy luận này, song thời điểm đó không hiển thị bất kỳ bước suy nghĩ trung gian nào cho người dùng mà chỉ hiển thị câu trả lời cuối cùng.
Các mô hình suy luận của DeepSeek, chẳng hạn R1, hiển thị từng bước cho người dùng. Khi trang Insider thử nghiệm ứng dụng AI của DeepSeek với cài đặt DeepThink (R1) hay Suy nghĩ sâu (R1), nó đã cung cấp khoảng 16 trang các bước toán học trước khi đưa ra câu trả lời đúng cho một câu hỏi khó.
Gần đây, OpenAI sẽ làm theo cách tiếp cận của DeepSeek khi bổ sung tùy chọn Reason trong ChatGPT.
Hôm 10.2, Sam Altman thừa nhận DeepSeek đã "làm tốt" trong việc tạo ra chatbot AI để cạnh tranh với ChatGPT. Doanh nhân 39 tuổi người Mỹ nói: “DeepSeek đã làm được một số điều tốt. Tôi nghĩ DeepSeek đã thực hiện một số cải tiến đáng chú ý về sản phẩm, chẳng hạn hiển thị chuỗi suy nghĩ rõ ràng - điều mà mọi người muốn. Khả năng tiếp cận rộng rãi trong phiên bản miễn phí là điều mà mọi người mong muốn. Về mặt nghiên cứu, nó không phải là bản cập nhật lớn với chúng tôi, dù họ đã thực hiện một số điều tốt ở đó”.
Dù OpenAI tuyên bố có bằng chứng rằng DeepSeek đã sử dụng quy trình distillation (chưng cất) để huấn luyện mô hình của mình dựa trên dữ liệu công ty Mỹ mà không có sự cho phép, Sam Altman vẫn không có kế hoạch khởi kiện đối thủ.
Ông nhấn mạnh OpenAI sẽ tiếp tục đổi mới và duy trì vị thế dẫn đầu, thay vì vướng vào các tranh chấp pháp lý.
![Sam Altman đánh giá cao chatbot AI của DeepSeek - Ảnh: Internet](https://photo-baomoi.bmcdn.me/w700_r1/2025_02_11_287_51450246/40dbda61ef2f06715f3e.jpg)
Sam Altman đánh giá cao chatbot AI của DeepSeek - Ảnh: Internet
Yann LeCun cho rằng bài học quan trọng nhất từ thành công của DeepSeek là giá trị của các mô hình AI mã nguồn mở so với mô hình độc quyền.
Các mô hình Llama của Meta Platforms chủ yếu là mã nguồn mở, cho phép bất kỳ ai truy cập các thông tin quan trọng như trọng số và tham số miễn phí. Việc chia sẻ cách hoạt động bên trong các mô hình AI như vậy giúp các nhà phát triển và nhiều công ty khác có thể tùy chỉnh chúng theo nhu cầu riêng.
Dù có tên là OpenAI nhưng đến nay, công ty này lại có cách tiếp cận khép kín hơn trong phát triển AI. Hầu hết mô hình của OpenAI đều là nguồn đóng và công ty khởi nghiệp này tính phí để truy cập.
Trong phiên hỏi đáp trên Reddit, Sam Altman được hỏi liệu OpenAI có cân nhắc phát hành một số trọng số mô hình và công bố các nghiên cứu hay không.
“Có, chúng tôi đang thảo luận về điều đó. Cá nhân tôi nghĩ rằng chúng tôi đã đi sai hướng của lịch sử trong vấn đề này và cần tìm ra một chiến lược nguồn mở khác. Không phải ai ở OpenAI cũng đồng tình quan điểm này và đây cũng không phải là ưu tiên cao nhất hiện tại của chúng tôi”, doanh nhân này trả lời.