AI sẽ được 'dạy' tiếng Việt, trở thành công cụ cho mọi người Việt
Đưa tiếng Việt vào Trí tuệ nhân tạo (AI) một cách tự nhiên, chuẩn hóa tiếng Việt là mục tiêu để nâng cao hơn nữa tính ứng dụng của AI
Trí tuệ nhân tạo (AI) được ứng dụng ngày càng rộng rãi tại Việt Nam, tuy nhiên ngôn ngữ tiếng Việt đưa vào AI còn thiếu tự nhiên, chưa chuẩn hóa.
Trên đây là nhận định của ông Trần Việt Hùng, Nhà sáng lập & CEO, Tổ chức AI for Vietnam, tại buổi khởi động Chương trình Thách thức Đổi mới sáng tạo 2025 do Trung tâm Đổi mới sáng tạo quốc gia Việt Nam (NIC - Bộ Tài chính) phối hợp cùng Tập đoàn Meta tổ chức ngày 14-3.

Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia Võ Xuân Hoài giới thiệu về dự án ViGen
Chương trình năm nay tập trung vào dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Dự án góp phần khắc phục những bất cập của tiếng Việt trong AI mà ông Hùng nêu ở trên.
Ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia, cho hay dự án này được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI, đồng thời góp phần thúc đẩy nền kinh tế số phát triển vượt bậc và bền vững.
Ông Hoài nhấn mạnh AI đang chuyển đổi thế giới, do đó việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách. Việc phát triển dự án ViGen nhằm biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI toàn cầu.
Theo ông Võ Xuân Hoài, dự án ViGen khởi nguồn từ hợp tác ba bên giữa Tập đoàn Meta, NIC và tổ chức "AI for Vietnam". Với dự án này, sẽ làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khóa tiềm năng các ứng dụng AI tại Việt Nam. Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hóa và tiêu chuẩn đạo đức ở Việt Nam.
Chia sẻ cụ thể hơn về dự án, PGS-TS Nguyễn Trường Thắng, Viện trưởng Viện Công nghệ Thông tin (Viện Hàn Lâm Khoa học và Công nghệ Việt Nam), cho biết nói một cách dễ hiểu, là chúng ta sẽ "dạy" ngôn ngữ tiếng Việt cho AI. Theo ông Thắng, nếu AI xây dựng trên nền tảng mã nguồn mở, chúng ta có thể dạy, huấn luyện AI và nó hấp thụ thông tin rất nhanh.
"Với việc được tạo ra từ mã nguồn mở giúp, chúng ta có thể tiếp cận và huấn luyện để biến Ai trở nên thuần Việt hơn, chuẩn hóa tiếng Việt"- PGS-TS Nguyễn Trường Thắng cho hay.
Ông Yann LeCun, Phó chủ tịch, Kiến trúc sư trưởng về Trí tuệ Nhân tạo của Tập đoàn Meta, đánh giá dự án ViGen và thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam.