Nâng cao sự hiện diện của tiếng Việt trong phát triển AI tại Việt Nam
Sáng 14/3, Tập đoàn Meta phối hợp cùng Trung tâm Đổi mới sáng tạo Quốc gia (NIC) khởi động Chương trình Thách thức Đổi mới sáng tạo (VIC 2025), với mục tiêu thúc đẩy phát triển lĩnh vực Al tại Việt Nam.

Toàn cảnh họp báo khởi động Chương trình Thách thức Đổi mới sáng tạo 2025. Ảnh: Mekong ASEAN
Chương trình VIC 2025 tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt.
Dự án ViGen khởi nguồn từ hợp tác ba bên giữa Tập đoàn Meta, Trung tâm Đổi mới sáng tạo Quốc gia (NIC) thuộc Bộ Tài chính và tổ chức "Al for Vietnam". Trong đó, NIC đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia của Việt Nam. Al for Vietnam là đối tác triển khai dự án với những hỗ trợ về kỹ thuật và tài chính từ Tập đoàn Meta. Các đối tác chiến lược bao gồm NVIDIA, Viettel và Viện Hàn lâm Khoa học và Công nghệ Việt Nam.
Sứ mệnh của VIC 2025 - Dự án ViGen là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khóá tiềm năng các ứng dụng AI tại Việt nam. ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI.
Dự án ViGen cũng đóng góp vào việc bảo đảm sự phát triển Al ở Việt Nam phù hợp với giá trị văn hóa và tiêu chuẩn đạo đức ở Việt Nam, hướng tới việc xây dựng một hệ sinh thái Al mã nguồn mở phù hợp với bối cách địa phương và có trách nhiệm.
Ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia nhấn mạnh, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá Al đã trở thành ưu tiên cấp bách. Dự án ViGen phù hợp với Nghị quyết 57 của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.
"Dự án đòi hỏi nỗ lực chung từ các nhà hoạch định chính sách, nhóm nghiên cứu, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng. Cùng nhau, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI toàn cầu," ông Hoài cho biết.

Ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia. Ảnh: NIC
TS Trần Việt Hùng, nhà sáng lập kiêm CEO Tổ chức AI for Vietnam, cho rằng trong bối cảnh AI phát triển nhanh như hiện nay, nếu Việt Nam không tận dụng được thì sẽ tuột mất cơ hội phát triển. Để Việt Nam tận dụng được AI thì việc hỗ trợ tiếng Việt đóng vai trò quan trọng.
Hiện nay, các dữ liệu đào tạo tiếng Việt trong lĩnh vực AI chỉ chiếm 0,8%, một phần rất nhỏ về đầu vào. Vì vậy, mặc dù đầu ra các mô hình AI có giá trị thông tin nhưng chưa truyền tải hết được ngôn ngữ cũng như văn hóa Việt Nam, dẫn đến việc ứng dụng AI chưa hiệu quả.
Theo đó, dự án ViGen được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI, đồng thời góp phần thúc đẩy nền kinh tế số phát triển vượt bậc và bền vững.

TS Trần Việt Hùng, nhà sáng lập kiêm CEO Tổ chức AI for Vietnam. Ảnh: NIC
Giáo sư Yann LeCun, Phó Chủ tịch, Kiến trúc sư trưởng về Trí tuệ Nhân tạo của Tập đoàn Meta đánh giá, dự án ViGen và Thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai Al toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam.
Bên cạnh Dự án ViGen với trọng tâm nâng cao sự hiện diện của tiềng Việt trong phát triển AI thông qua các bộ dữ liệu mã nguồn mở, Meta và Deloitte cũng công bố cuốn cẩm nang dành cho khu vực công mang tên "Đổi mới sáng tạo trong khu vực công ở Châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Lama".
Cẩm nang này sẽ cung cấp lộ trình giúp các cơ quan chính phủ tích hợp hiệu quả công nghệ AI mã nguồn mở. Sự kết hợp giữa các sáng kiến này hướng đến mục tiêu xây dựng một chiến lược AI đồng bộ tại Việt Nam, mang lại lợi ích cho cả khu vực công và tư nhân.