Các quốc gia châu Á, từ Trung Quốc đến Hàn Quốc, Nhật Bản và Việt Nam, gia nhập cuộc đua AI
Ước tính chỉ có khoảng 5% dân số toàn cầu nói tiếng Anh như ngôn ngữ đầu tiên, nghĩa là có nhu cầu tiềm ẩn lớn về AI được phát triển cho những người không nói tiếng Anh bản xứ...
Theo Nikkei Asia, một cuộc đua phát triển các chương trình trí tuệ nhân tạo tổng quát đang diễn ra sôi động tại châu Á. Các quốc gia châu Á đang lần lượt ra mắt những công cụ AI tổng quát được thiết kế dành riêng cho ngôn ngữ địa phương của từng nước.
Theo ước tính từ Bloomberg Intelligence, thị trường AI tổng quát toàn cầu đang mở rộng 42% mỗi năm và dự kiến sẽ đạt 1,3 nghìn tỷ USD vào năm 2032, gấp khoảng 32 lần quy mô 40 tỷ USD vào năm 2022.
Dẫn đầu là các công ty công nghệ của Hoa Kỳ, như OpenAI, Google và Amazon.com, những công ty có nguồn vốn và nhân tài dồi dào để thâm nhập thị trường. Nhiều công ty trên khắp thế giới sử dụng ChatGPT và các tùy chọn phức tạp khác được phát triển ở Hoa Kỳ.
Tại Việt Nam, ViGPT của Vingroup đã ra mắt và thu hút sự chú ý của công chúng lẫn giới công nghệ. là sản phẩm được công ty con của tập đoàn Vingroup, VinBigData, phát triển, ViGPT được thiết kế để tương tác với người dùng bằng tiếng Việt.
Giáo sư Vũ Hà Vân, giáo sư toán học tại Đại học Yale, đồng thời là Giám đốc khoa học tại VinBigData, cho biết bất chấp cạnh tranh sâu sắc, VinGroup đã chọn phát triển độc lập phiên bản của mình vì nhóm có thể sử dụng dữ liệu của Việt Nam để tạo ra AI có độ chính xác cao hơn đối thủ nước ngoài.
Nhiều chương trình AI tổng quát đào tạo trên dữ liệu tiếng Anh. Điều đó có nghĩa là có tương đối ít dữ liệu từ Việt Nam, làm giảm độ chính xác của các chương trình đó khi nói đến văn hóa, lịch sử và luật pháp Việt Nam.
Mô hình ngôn ngữ lớn (LLM) của ViGPT được cho là hoạt động từ 1,6 tỷ tham số, tương đương vài phần trăm kích thước của GPT-4 của OpenAI.
Nhiều thông số hơn thường tương đương với trí thông minh cao hơn. Nhưng theo Vietnamese Multitask Language Understanding, một tiêu chuẩn đánh giá AI tổng quát được tùy chỉnh cho thị trường Việt Nam, ViGPT vượt trội hơn nhiều đối thủ nước ngoài và đạt được số điểm chỉ đứng sau ChatGPT.
VinFast đang ứng dụng công nghệ AI vào xe điện, tài xế có thể điều khiển phương tiện thông qua mệnh lệnh bằng lời nói tiếng Việt. Tập đoàn cũng có kế hoạch kết hợp AI vào lĩnh vực tài chính, bảo hiểm và hậu cần.
Ước tính chỉ có khoảng 5% dân số toàn cầu nói tiếng Anh như ngôn ngữ đầu tiên, nghĩa là có nhu cầu tiềm ẩn lớn về AI được phát triển cho những người không nói tiếng Anh bản xứ.
Tại Nhật Bản, các công ty đang phát triển AI tạo ra tiếng Nhật. Vào tháng 8, tập đoàn điện tử NEC đã triển khai dịch vụ sử dụng LLM cotomi. Công ty viễn thông NTT sẽ bắt đầu dịch vụ vào tháng 3 dựa trên tsuzumi, một LLM khác. Cả hai mẫu LLM đều thể hiện hiệu suất cao về mặt ngôn ngữ tiếng Nhật.
Nhà cung cấp dịch vụ di động Nhật Bản SoftBank Corp. cũng đang phát triển LLM của riêng mình.
Chủ tịch SoftBank Junichi Miyakawa cho biết: “Hiểu được các hoạt động kinh doanh của Nhật Bản sẽ mang lại lợi thế về khả năng sử dụng, chẳng hạn như khả năng trả lời email và thực hiện công việc của trung tâm khách hàng theo cách tự nhiên hơn”.
Theo Nikkei, động lực đằng sau cuộc đua phát triển AI bản địa hóa là nhằm tránh những rủi ro do quá phụ thuộc vào các ứng dụng AI nước ngoài, đặc biệt là khi nói đến khả năng cạnh tranh quốc tế và an ninh quốc gia. Cũng có lo ngại rằng việc sử dụng các chương trình AI được phát triển ở quốc gia khác sẽ dẫn đến vi phạm dữ liệu, ảnh hưởng đến thông tin nhạy cảm.
Trung Quốc đang cạnh tranh công nghệ gay gắt với Mỹ, các tập đoàn như Baidu, Tencent Holdings và Alibaba Group Holding đang phát triển AI sáng tạo. Ernie Bot của Baidu tự hào có hơn 100 triệu người dùng tính đến cuối năm ngoái.
Chủ tịch kiêm Giám đốc điều hành Baidu Robin Li cho biết: “Mô hình ngôn ngữ lớn mà chúng tôi đang phát triển hiện nay sẽ phù hợp hơn với ngôn ngữ Trung Quốc và thị trường Trung Quốc”.
Tháng 8 năm ngoái, công ty dịch vụ mạng Naver của Hàn Quốc đã tiết lộ HyperClova X, AI tổng hợp được tùy chỉnh cho ngôn ngữ Hàn Quốc. Chương trình sẽ được tích hợp với công cụ tìm kiếm và nền tảng mua sắm trực tuyến của công ty để cho phép người dùng tìm thấy kết quả họ muốn một cách hiệu quả hơn.
Naver cho biết cơ sở dữ liệu tiếng Hàn của họ lớn hơn 6.500 lần so với dữ liệu tiếng Hàn của ChatGPT, giúp tạo ra văn bản đọc tự nhiên hơn và nhận dạng ngôn ngữ mượt mà hơn.
Tháng trước Singapore đã công bố kế hoạch phát triển LLM phù hợp với các ngôn ngữ Indonesia, Mã Lai và Thái Lan. Tuy nhiên, những sáng kiến như vậy sẽ phải đối mặt với những thách thức, chẳng hạn như thiếu dữ liệu có thể đào tạo bằng các ngôn ngữ ít được sử dụng và lợi nhuận của việc phát triển các mô hình như vậy.