Trí tuệ nhân tạo 'đặt chân' vào thế giới ngôn ngữ tiếng Việt

Việc kết hợp khoa học máy tính có thể giúp đẩy nhanh quá trình học những ngôn ngữ vốn không phải tiếng mẹ đẻ.

Việc kết hợp khoa học máy tính có thể giúp đẩy nhanh quá trình học những ngôn ngữ vốn không phải tiếng mẹ đẻ.

Sự xuất hiện của trí tuệ nhân tạo (AI) có thể thúc đẩy quá trình học cả những ngôn ngữ được xem là khó như tiếng Việt. Quá trình này không chỉ giúp con người học ngoại ngữ nhanh hơn, mà còn hỗ trợ AI “hiểu” và “phản hồi” tự nhiên hơn.

Lãnh đạo của một doanh nghiệp có vốn đầu tư tiếp trực tiếp nước ngoài (FDI) tại Việt Nam mong muốn học tiếng Việt nhanh, đọc được 90% nội dung các văn bản thông thường. Tuy nhiên, ông quá bận và chỉ có khoảng một tiếng nghỉ trưa mỗi ngày để học. Vấn đề đặt ra là cần áp dụng công nghệ vào phần mềm học ngôn ngữ ra sao để giúp vị lãnh đạo này học ngoại ngữ nhanh?

Đây là bài toán của vị lãnh đạo công ty FDI đặt ra với PGS.TS Đinh Điền - Giám đốc Trung tâm Ngôn ngữ học tính toán, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia TP.HCM.

Là người có nhiều đề tài nghiên cứu khoa học, công trình công bố quốc tế về áp dụng trí tuệ nhân tạo (AI) trong dịch máy, ngôn ngữ học đối chiếu và dạy tiếng Việt cho người nước ngoài, PGS.TS Đinh Điền cho rằng việc ứng dụng AI đặc biệt cần thiết để giải quyết các vấn đề thuộc lĩnh vực ngôn ngữ học.

Cụ thể, bước đầu tiên để học bất kỳ một ngôn ngữ nào là học ngữ âm. Rào cản nằm ở chỗ tiếng Việt có thanh điệu. Do đó, việc dạy cho những người học thuộc hệ ngôn ngữ không có thanh điệu như Anh, Pháp… tương đối khó khăn. Đơn cử, thay vì hỏi “Bạn đi ngủ chưa?”, người học có thể nói “Bạn đi ngu chưa?”. Nguyên nhân là họ không phân biệt được thanh điệu. Người dạy cần chỉ họ đặt lưỡi ở đâu khi phát âm, khẩu hình miệng ra sao, tiếng phát ra đúng, sai và khác nhau thế nào.

Lúc này, phần mềm ứng dụng AI trong dạy ngoại ngữ có thể mô phỏng khẩu hình miệng, phát âm sẵn để người học bắt chước. Sau đó, người học tập phát âm lại, thu vào phần mềm, sử dụng công nghệ đối chiếu và so sánh chuẩn, từ đó nhanh chóng cải thiện khả năng. Tất cả công đoạn trên đều bắt buộc phải ứng dụng AI.

Một dẫn chứng khác, theo Từ điển tiếng Việt của Viện Ngôn ngữ học do cố giáo sư Hoàng Phê chủ biên, vốn từ gốc tiếng Việt có khoảng 34.000 từ. Tính toán cho thấy chỉ cần dạy 10% (tương đương 3.400 từ thông dụng), máy có thể đọc khoảng 90% văn bản tiếng Việt thông thường. Để có được dữ liệu thống kê này, PGS.TS Đinh Điền buộc phải sử dụng AI, gán nhãn lên hệ thống từ vựng trong kho ngữ liệu tiếng Việt.

Có thể nói, trí tuệ nhân tạo đã thay đổi cách dạy và học của ngành giáo dục. Thực tế, nhiều ứng dụng AI ra đời nhằm hỗ trợ quá trình dạy và học trở nên nhanh chóng, hiệu quả hơn.

Câu chuyện kết hợp khoa học máy tính và ngôn ngữ học phía trên cho thấy quá trình để huấn luyện, ứng dụng AI vào thực tiễn là rất cần thiết, nhưng không đơn giản. Các dữ liệu cần được phân tách theo nhiều lớp định danh. Trong đó, mỗi lớp cần xử lý tiếp từng biến số với những định danh cụ thể khác nhau.

Không chỉ hỗ trợ con người học ngôn ngữ, AI còn giúp hệ thống trợ lý thông minh hiểu tốt hơn. Có thể nói, với AI, máy móc được huấn luyện và tiến bộ mỗi ngày. Tương tự câu chuyện của PGS.TS Đinh Điền, dưới đây là một dẫn chứng sinh động khác về cách trợ lý thông minh hiểu ngôn ngữ con người.

Đó là quá trình nghiên cứu và phát triển trợ lý giọng nói tiếng Việt Kiki trên ôtô, để nhận dạng tốt giọng nói với nhiều ngữ điệu vùng miền. Trong khoa học máy tính, nhận dạng giọng nói là một nhánh quan trọng của AI, giúp chuyển đổi giọng nói con người thành một định dạng hữu ích và có thể hiểu được bằng các ứng dụng máy tính. Công nghệ này là cầu nối tương tác giữa máy móc và con người. Trợ lý giọng nói đã trở thành ứng dụng không thể thiếu trên toàn thế giới, phổ biến nhất có thể kể đến Siri của Apple, Google Assistant, Amazon Alexa hay Kiki ở Việt Nam.

Anh Nguyễn Hoàng Khánh Duy - người viết những dòng code đầu tiên cho Kiki - chia sẻ để huấn luyện mô hình AI đủ thông minh khi nhận diện giọng nói và phản hồi thông tin đúng cho người dùng, dữ liệu ngôn ngữ đóng vai trò chủ chốt.

Chức năng rất quan trọng với người dùng trợ lý tiếng Việt Kiki trên ôtô là dẫn đường. Do đó, đội ngũ phát triển sản phẩm phải chuẩn bị dữ liệu, vốn từ vựng để hỗ trợ “mượt” cho các câu lệnh từ người dùng. Sau quá trình thu thập dữ liệu, huấn luyện mô hình, chỉ số thể hiện chất lượng nhận diện giọng nói ở phiên bản sau đã cải thiện 40% so với ban đầu.

Việc nhận diện giọng nói trên ôtô không chỉ dừng lại ở mỗi bài toán về dẫn đường, địa điểm mà còn nhiều vấn đề khác.

Ví dụ, với đặc thù sử dụng Kiki trên ôtô, tiếng ồn do động cơ, gió hay âm thanh phát ra từ các thiết bị giao thông trên đường là rất lớn. Điều này ảnh hưởng trực tiếp tới chất lượng nhận diện của Kiki trên xe, đòi hỏi đội ngũ Kiki phải cố gắng giả lập điều kiện ồn bằng cách tăng cường dữ liệu giọng nói trong điều kiện sát với thực tế nhất.

Ngoài ra, bằng các kỹ thuật mới trên thế giới như self-supervised (học tự giám sát), Kiki đang cố gắng “học” từ cả những dữ liệu không được gán nhãn để cải thiện mô hình hơn nữa. Tính ổn định của trợ lý giọng nói tiếng Việt này đang cải thiện với việc không ngừng đào tạo và nâng cấp sản phẩm.

Công nghệ đang tiến bộ hàng ngày, hàng giờ. ChatGPT ra đời cuối năm 2022 đã trả lời một phần câu hỏi về cách dữ liệu lớn vận hành. Công nghệ đang bước vào đời sống, đặc biệt trong giáo dục và ngôn ngữ - những lĩnh vực vốn phụ thuộc nhiều vào con người trước đây. Với những ví dụ cụ thể nêu trên, có thể thấy, AI tái định nghĩa cách con người học tập, làm việc, sinh hoạt...

Minh Đắc

Nguồn Znews: https://zingnews.vn/tri-tue-nhan-tao-dat-chan-vao-the-gioi-ngon-ngu-tieng-viet-post1440063.html