CEO Got It chia sẻ về dự án ViGen và tham vọng biến AI thành lợi thế cạnh tranh quốc gia

TS Trần Việt Hùng nói rằng hiện nay tiếng Việt chỉ chiếm khoảng 1% trong các mô hình AI. Việc tạo các bộ dữ liệu tiếng Việt từ dự án ViGen sẽ giúp tăng sự hiện diện của Việt Nam trong các mô hình AI thế giới, tạo lợi thế cạnh tranh.

Tiến sĩ Trần Việt Hùng, thường được biết đến với tên Hùng Trần. Ông tốt nghiệp Tiến sĩ ngành Khoa học máy tính tại Đại học Iowa, Hoa Kỳ.

Năm 2011, ông sáng lập Got It - một công ty khởi nghiệp tại Thung lũng Silicon, Mỹ, chuyên phát triển nền tảng kiến thức như một dịch vụ (Knowledge as a Service - KaaS), kết nối người dùng với các chuyên gia để giải quyết vấn đề một cách nhanh chóng và hiệu quả.

Năm 2020, TS Trần Việt Hùng cùng các cộng sự thành lập STEAM for Vietnam, một tổ chức phi lợi nhuận nhằm phổ cập giáo dục STEAM (Khoa học, Công nghệ, Kỹ thuật, Nghệ thuật và Toán học) cho học sinh Việt Nam. Dự án này đã thu hút hàng nghìn học viên từ nhiều quốc gia tham gia các khóa học trực tuyến miễn phí, giúp trang bị cho thế hệ trẻ Việt Nam những kỹ năng cần thiết trong thời đại công nghệ số.

TS Trần Việt Hùng cũng là thành viên trẻ nhất trong Tổ tư vấn của Ủy ban Quốc gia Đổi mới Giáo dục và Đào tạo giai đoạn 2016-2021, góp phần vào việc phát triển nguồn nhân lực chất lượng cao cho Việt Nam trong bối cảnh Cách mạng Công nghiệp 4.0.

Mới đây, ông và các cộng sự người Việt đang làm việc tại Thung lũng Silicon đã thành lập tổ chức "AI for Vietnam" với mục tiêu triển khai dự án ViGen - tạo ra các bộ dữ liệu tiếng Việt mã nguồn mở toàn diện và chất lượng cao, giúp AI hiểu sâu sắc các nét đặc trưng của ngôn ngữ và văn hóa Việt. Từ đó, thúc đẩy ứng dụng AI sâu rộng tại Việt Nam, tận dụng cơ hội biến AI thành công cụ để phát triển kinh tế, tạo lợi thế cạnh tranh quốc gia.

VietTimes đã trao đổi với TS Trần Việt Hùng để tìm hiểu sâu hơn về dự án rất ý nghĩa này.

- Được biết, ông và một số cộng sự đã thành lập tổ chức “AI for Vietnam” và ông đang đảm nhận vai trò CEO của tổ chức này. Vì đâu mà ông và các cộng sự đi đến quyết định này?

- Trong thời gian gần đây, Generative AI (AI tạo sinh) đã có những tiến bộ đột phá với tốc độ rất nhanh và đã bắt đầu thực sự làm được nhiều việc tốt hơn con người.

Nhiều quốc gia, công ty, và các cá nhân đang nhanh chóng nắm bắt cơ hội trong việc ứng dụng sức mạnh không tưởng của Generative AI trong xử lý các tác vụ hàng ngày với mục tiêu tăng hiệu suất và tạo ra lợi thế cạnh tranh.

AI for Vietnam là một tổ chức phi lợi nhuận được thành lập tại Mỹ bởi các chuyên gia AI người Việt đang học tập, nghiên cứu, và làm việc ở khắp nơi trên thế giới. Mục tiêu của tổ chức là thúc đẩy ứng dụng AI sâu rộng tại Việt Nam, giúp Việt Nam tận dụng cơ hội biến AI thành công cụ để phát triển kinh tế cũng như nâng cao chất lượng cuộc sống của người dân.

Trong các làn sóng công nghệ trước đây, Việt Nam luôn là quốc gia đi sau. Tuy nhiên, với làn sóng công nghệ mới diễn ra này thì Generative AI mới mẻ với cả thế giới, cho nên Việt Nam hoàn toàn có cơ hội để đi cùng với các nước phát triển khác nếu chúng ta đủ nhanh nhạy.

Mơ ước của các thành viên AI for Vietnam là Việt Nam sẽ là một điểm sáng trên toàn cầu về ứng dụng AI.

- Mục tiêu của AI for Vietnam là để người Việt có thể ứng dụng Generative AI trong mọi khía cạnh của cuộc sống. Liệu mục tiêu này có quá tham vọng không thưa ông? Nói cách khác, nhóm AI for Vietnam sẽ có rất nhiều việc phải làm, phải giải quyết. Ông có thể hình dung những thuận lợi và khó khăn mà dự án ViGen của AI for Vietnam sẽ phải trải qua?

- Đúng là với một mục tiêu đầy tham vọng như vậy mà mình tự làm hết thì gần như là không thể. Thế nên chiến lược của AI for Vietnam là học theo các dự án phần mềm mã nguồn mở và sáng tạo mở để mình có thể đứng trên vai những người khổng lồ.

Chúng tôi cùng các đối tác sẽ tập trung vào việc lấp đầy khoảng trống giữa năng lực của AI trong xử lý các tác vụ bằng tiếng Anh và các tác vụ tương tự bằng tiếng Việt, chứ chúng tôi không tự đào tạo các mô hình từ đầu.

Như chúng ta đã biết, trong các bộ dữ liệu đào tạo AI phổ biến đang được công bố rộng rãi thì tỷ lệ tiếng Việt đâu đó chỉ khoảng 1%, trong khi tiếng Việt có tới hơn 100 triệu người dùng.

Một việc có thể làm ngay là tăng tỷ lệ tiếng Việt trong các bộ dữ liệu đào tạo các mô hình AI bằng cách tạo ra bộ dữ liệu tiếng Việt để đào tạo AI với quy mô lớn nhất và chất lượng cao nhất từ trước tới giờ.

Ngoài ra còn phải có các bộ dữ liệu dùng để đánh giá khả năng thực hiện các tác vụ bằng tiếng Việt của AI nữa để chúng ta có sự tự tin nhất định khi chọn và sử dụng một mô hình AI nào đó.

Mục tiêu của AI for Vietnam là rất tham vọng nên đương nhiên là có rất nhiều thử thách, vì sẽ phải thu gom và xử lý một lượng dữ liệu khổng lồ một cách vô cùng cẩn thận và tỉ mỉ để đảm bảo có số lượng token tiếng Việt lớn bao phủ nhiều tình huống sử dụng tiếng Việt hàng ngày, và chất lượng cao để khi AI tạo ra nội dung tiếng Việt thì kết quả sẽ sạch và có độ tin cậy cao.

Còn về thuận lợi thì đầu tiên là AI for Vietnam đã và đang tập hợp được một đội ngũ lớn các tình nguyện viên là người Việt đang học tập, nghiên cứu, và làm việc trong mảng trí tuệ nhân tạo và công nghệ, tạo ra lợi thế về kiến thức và kinh nghiệm cho tổ chức.

Ngoài ra AI for Vietnam còn có sự đồng hành của rất nhiều cơ quan, doanh nghiệp như: Trung tâm đổi mới sáng tạo quốc gia (NIC), Meta, NVIDIA, Viettel, Viện Công nghệ Thông tin thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Greennode, DeepTensor, ZTO Labs,… để có tài nguyên tính toán, các bộ dữ liệu có sẵn, cũng như lực lượng các chuyên gia có thể tham gia nghiên cứu và xây dựng các bộ dữ liệu cụ thể.

Các hoạt động của AI for Vietnam cũng được sự quan tâm lớn từ truyền thông và các cá nhân, tạo tiền đề cho các hoạt động mang tính cộng đồng góp phần vào xây dựng và kiểm thử các bộ dữ liệu.

- Chắc chắn để đạt được mục tiêu nói trên sẽ là một chặng đường dài. Những mục tiêu ngắn hạn trước mắt là gì thưa ông?

- Trong ngắn hạn thì chúng tôi tập trung vào xây dựng các bộ dữ liệu tiếng Việt chia làm hai nhóm.

Nhóm thứ nhất là dữ liệu dùng để đào tạo các mô hình Generative AI. Chúng tôi sẽ tập hợp các nguồn dữ liệu đã có, bổ sung thêm dữ liệu mới, làm sạch, và đóng gói để có thể cung cấp dưới dạng nguồn mở sau đó hợp tác với những công ty hay tập đoàn lớn như Meta để họ đưa bộ dữ liệu tiếng Việt này vào trong quá trình đào tạo mô hình Generative AI thế hệ mới của họ.

Hy vọng rằng với tỷ lệ dữ liệu tiếng Việt chất lượng cao lớn, các mô hình mới được tạo ra sẽ có khả năng hỗ trợ tiếng Việt một cách tự nhiên ngay từ trong lõi. Sau đó các nhà nghiên cứu hay các nhà phát triển ứng dụng AI có thể lấy các mô hình nguồn mở này, ví dụ Llama, để xây dựng ra các ứng dụng AI tiếng Việt cho thị trường Việt Nam.

Chúng tôi cho rằng hướng tiếp cận đứng trên vai những người khổng lồ thế này vừa đỡ tốn kém chi phí đào tạo mô hình AI, vừa nhanh chóng có thể đưa các ứng dụng AI tiếng Việt vào trong mọi ngõ ngách cuộc sống ở Việt Nam.

Nhóm thứ hai bao gồm các bộ dữ liệu dùng để đánh giá khả năng giải quyết các tác vụ bằng tiếng Việt của các mô hình AI. Cái này giống như những bài thi về tiếng Việt cho các mô hình AI vậy để người dùng Việt Nam có các thông tin trong việc chọn lựa mô hình AI phù hợp cho các mục tiêu cụ thể của mình.

Việc xây dựng các bộ dữ liệu tiếng Việt này nằm trong dự án ViGen do tổ chức AI for Vietnam, Meta, và NIC khởi xướng với các đối tác chiến lược là Viettel, NVIDIA, Viện Công nghệ Thông tin thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Chúng tôi đã đề xuất ra một hệ sinh thái và lộ trình phát triển trong vòng 3 năm tới.

Video giới thiệu dự án ViGen do tổ chức AI for Vietnam phối hợp với NIC và Meta thực hiện

- Trong dài hạn thì mục tiêu cụ thể nhất mà AI for Vietnam muốn đạt được là gì thưa ông?

- Nhiệm vụ chính của AI for Vietnam là thúc đẩy ứng dụng AI tại Việt Nam một cách sâu rộng để Việt Nam có thể tận dụng AI trong việc phát triển kinh tế cũng như nâng cao chất lượng cuộc sống của người dân.

Nếu Việt Nam trở thành một điểm sáng trong việc ứng dụng AI và biến AI thành lợi thế cạnh tranh của quốc gia và đi cùng với thế giới trong làn sóng công nghệ AI lần này thì đó sẽ là một điều tuyệt vời.

Xa hơn nữa nếu AI for Vietnam tập hợp được đội ngũ chuyên gia đủ lớn và một mạng lưới các đối tác hỗ trợ thì hy vọng sẽ cùng nhau nghiên cứu và phát triển được một công nghệ mới, không chỉ ứng dụng cho Việt Nam mà còn có sức ảnh hưởng lớn hơn.

- Nghị định 57 của Bộ Chính trị ban hành tháng 12/2024 có đề cập đến việc thành lập một quỹ đầu tư mạo hiểm cho các sáng kiến khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số. Được biết, quỹ này sẽ sớm được ra mắt trong năm 2025. Liệu tổ chức AI for Vietnam có dự định tìm nguồn đầu tư từ quỹ này không thưa ông?

- Bản thân AI for Vietnam là một tổ chức phi lợi nhuận và hoạt động rất giống với các dự án phần mềm nguồn mở, vì thế chúng tôi sẽ không tìm kiếm các khoản đầu tư, mà tìm kiếm các khoản tài trợ hoặc tự tạo ra nguồn thu để duy trì các hoạt động.

Tuy nhiên hy vọng rằng với những kết quả mà AI for Vietnam tạo ra, sẽ có một loạt các startup được thành lập để xây dựng các ứng dụng hay giải pháp AI phục vụ cho thị trường Việt Nam ở nhiều lĩnh vực khác nhau. Nếu các startup này có cơ hội để nhận được đầu tư từ quỹ thì đó sẽ là một điều rất tuyệt vời.

- Tổ chức AI for Vietnam có đa phần là các chuyên gia người Việt đang sống tại nước ngoài, đang làm việc cho các tập đoàn công nghệ lớn của nước ngoài. Ông đánh giá thế nào về nguồn nhân lực AI trong nước? Liệu nguồn lực trong nước có thể đáp ứng được nhu cầu phát triển AI mạnh mẽ hơn không, có thể tham gia dự án AI for Vietnam không?

- AI for Vietnam có một lợi thế rất lớn là sự tham gia rất nhiệt tình từ các chuyên gia AI người Việt ở khắp nơi trên thế giới với một mục tiêu chung là muốn Việt Nam khai thác tốt được sức mạnh vô cùng lớn của AI để phát triển.

Gần đây khi nói tới AI thì chúng ta thường hàm ý là Generative AI, vì Generative AI còn rất mới với cả thế giới nên nguồn nhân lực trong mảng này ở Việt Nam chưa có nhiều.

 TS Trần Việt Hùng tại sự kiện công bố dự án ViGen, ngày 14.3 tại Hà Nội

TS Trần Việt Hùng tại sự kiện công bố dự án ViGen, ngày 14.3 tại Hà Nội

Tuy nhiên Generative AI rất dễ tiếp cận, đặc biệt trong mảng ứng dụng nên hy vọng rằng Việt Nam sẽ nhanh chóng có một đội ngũ nhân lực tốt để có thể phát triển các ứng dụng Generative AI tiếng Việt dựa trên kết quả của dự án ViGen phục vụ cho nhiều lĩnh vực khác nhau để tăng hiệu suất học tập, làm việc, kinh doanh,…

- Kinh nghiệm thành lập startup Got It có giúp ích gì cho việc thành lập AI for Vietnam không thưa ông?

- Vận hành Got It cũng như STEAM for Vietnam cho tôi rất nhiều bài học kinh nghiệm để có thể xây dựng AI for Vietnam tốt hơn. Từ việc định ra mục tiêu cũng như hướng tiếp cận tới quy tập đội ngũ, tìm kiếm các đối tác, và vận hành.

Tuy nhiên quy mô và độ phức tạp của AI for Vietnam cũng ở một tầm cao mới vì các hoạt động rất tham vọng. Thế nên tôi cũng như đội ngũ AI for Vietnam vừa vận hành và vừa học hỏi để điều chỉnh.

- Trong khi nước láng giềng Trung Quốc đã đạt được những thành tựu có thể nói là “kinh ngạc” trong lĩnh vực AI, với sự ra đời của hàng chục mô hình AI mạnh mẽ của riêng họ. Theo ông, Việt Nam có thể học tập gì ở Trung Quốc hoặc các quốc gia khác trong con đường phát triển AI của mình? Ông hãy dự đoán bao giờ Việt Nam có thể có được một mô hình AI giống như DeepSeek hoặc Manus?

- Các kỹ sư Trung Quốc tạo ra được các kết quả gây shock cho toàn thế giới là điều mà nhiều người có thể hình dung được. Ngay từ trước làn sóng Generative AI thì Trung Quốc đã rất mạnh về trí tuệ nhân tạo, đặc biệt là các ứng dụng vô cùng rộng rãi về thị giác máy tính.

Các kỹ sư Trung Quốc có kiến thức nền tảng và kỹ năng thực thi rất tốt. Không chỉ ở Trung Quốc mà ở những nơi khác trên thế giới như Silicon Valley họ rất được kính nể.

Tôi nghĩ rằng Việt Nam có thể tạo ra được các công nghệ đột phá như DeepSeek khi và chỉ khi chúng ta có một lực lượng rất lớn các kỹ sư giỏi theo đúng nghĩa kỹ sư. Điều này phụ thuộc rất nhiều vào các chương trình đào tạo kỹ sư ở bậc đại học.

- Theo ông, trong những năm tới, Việt Nam nên tập trung vào phát triển AI hay chất bán dẫn? Đâu là ưu tiên để Việt Nam có thể theo kịp các quốc gia tiên tiến về công nghệ trên thế giới?

- Tôi không có nhiều hiểu biết về bán dẫn nên rất khó để đưa ra sự lựa chọn chính xác, cá nhân tôi thì tôi luôn chọn AI.

- Xin cảm ơn ông về những chia sẻ này!

Đăng Khoa

Nguồn VietTimes: https://viettimes.vn/ceo-got-it-chia-se-ve-du-an-vigen-va-tham-vong-bien-ai-thanh-loi-the-canh-tranh-quoc-gia-post183709.html?utm_source=web_vt&utm_medium=home_noibat_vt&utm_campaign=noibat