Vương Quang Khải Zalo và bí quyết 'leo núi AI' của 'chàng Don Quixote'
Các dịch vụ AI trong Zalo hiện đã có nhiều triệu người dùng, nhưng cạnh tranh với Google, Facebook, Microsoft… vẫn như 'đánh cối xay gió'. Vương Quang Khải cùng các kỹ sư của mình sẽ tiếp tục hành trình ra sao? Chúng tôi có cuộc trò chuyện về cách tiếp cận của Zalo, cũng như cơ hội cho AI Việt Nam.
Những làn sóng công nghệ mới như AI sẽ thay đổi thế giới theo hai cách. Cách thứ nhất là tạo ra những ứng dụng hoàn toàn mới. Trợ lý Kiki là ứng dụng dạng này, và các công ty trên thế giới vẫn liên tục đưa ra nhiều thử nghiệm AI mới lạ. Cách thứ hai cũng tiềm năng không kém, đó là dùng công nghệ mới để cải tiến những sản phẩm dịch vụ sẵn có. AI đang len lỏi vào nhiều lĩnh vực khác và tạo ra những thay đổi lớn.
Từ 2023, hầu hết những nội dung mà người dùng tiếp cận trên hệ sinh thái Zalo đều do AI đề xuất. Sử dụng khả năng của trí tuệ nhân tạo, người dùng Zing MP3 nghe nhạc nhiều hơn và có thể khám phá những thể loại họ chưa từng biết tới. Tương tự, AI giúp tăng số bài Baomoi được đọc mỗi ngày thêm 25%. Adtima cũng đang ứng dụng AI vào các mảng sáng tạo nội dung quảng cáo hoặc tự động phân tích, tối ưu hiệu quả. Có lẽ chúng tôi là đơn vị Việt Nam đầu tiên kiếm được tiền từ quảng cáo AI, với chương trình Tết 2024 hợp tác cùng Pepsi.
Tôi tin rằng trong 10 năm tới thì hầu hết các sản phẩm dịch vụ sẽ phải tích hợp AI, nếu không sẽ trở nên lạc hậu và dần bị đào thải. Và các công ty đều phải chuẩn bị để đối mặt với làn sóng thần công nghệ này.
Còn ứng dụng Zalo thì có dự định gì tích hợp với GenAI - AI tạo sinh?
Cuối 2023, chúng tôi đạt mục tiêu bắt kịp GPT3.5 trong việc huấn luyện mô hình ngôn ngữ lớn tiếng Việt, sớm hơn kế hoạch 6 tháng. Vì thế đầu 2024, song song với việc tiếp tục nâng cao chất lượng để đuổi theo GPT4, tôi bắt đầu suy nghĩ về việc sẽ ứng dụng AI tạo sinh như thế nào.
Trên thực tế, có nhiều hướng tiếp cận tiềm năng. Ví dụ như nhiều người tin rằng chatbot thông minh như ChatGPT có thể thay thế các máy tìm kiếm Web cũ kỹ. Đây là một cơ hội lớn để thách thức Google và chen chân vào thị trường tìm kiếm. Nhiều công ty công nghệ đang nghiêm túc đầu tư cho hướng này.
Tuy vậy, sau khi đánh giá, tôi vẫn chọn tiếp cận dựa vào thế mạnh giao tiếp sẵn có của Zalo. Chúng tôi có 3 hướng ứng dụng GenAI: giải trí (làm người dùng vui vẻ hơn), công việc (tăng hiệu quả làm việc), và kinh doanh (hỗ trợ bán hàng và chăm sóc khách hàng).
Anh có thể chia sẻ thêm về 3 định hướng này?
Hướng thứ nhất làm cho người dùng vui hơn. Những sản phẩm như AI Avatar được đón nhận rất tích cực và nhanh chóng tạo xu hướng khắp mạng xã hội. Hay trước đây, vào các dịp lễ Tết hay ngày đặc biệt kiểu Valentine, Zalo phải đầu tư rất nhiều, thuê thiết kế các bộ, hình ảnh, lời chúc để người dùng chia sẻ. Sắp tới, AI sẽ đảm nhận vai trò họa sĩ, cho người dùng Zalo tự sáng tạo ra những tấm thiệp vui và độc đáo, mang phong cách riêng của mỗi người.
Hướng thứ 2 là nâng cao hiệu quả sử dụng Zalo hàng ngày. Từ những ngày đầu thì chúng tôi đã có chức năng gửi tin nhắn thoại, tuy nhiên gần đây có sự tăng trưởng vượt bậc nhờ khả năng tự động chuyển giọng nói sang văn bản. Đối tượng sử dụng chính là những người bận rộn cần nhắn nhanh hoặc người lớn tuổi không quen bấm phím. Chúng tôi cũng đang xây dựng tính năng dịch thuật Anh-Việt để phục vụ nhu cầu giao tiếp với người nước ngoài. Trước khi có các mô hình ngôn ngữ lớn thì công nghệ dịch này rất khó, nhưng giờ thì hoàn toàn khả thi.
Hướng thứ 3 là các giải pháp cho thương mại. Hiện tại đã có nhiều đơn vị cung cấp chatbot đơn giản để hỗ trợ bán hàng và chăm sóc khách hàng, tuy nhiên chất lượng chưa tốt nên ứng dụng còn hạn chế. Với GenAI, Zalo đang xây dựng các giải pháp chatbot mới dựa trên mô hình ngôn ngữ lớn tiếng Việt. Hiện đã bắt đầu áp dụng để chăm sóc khách hàng Zalo, tiếp đó sẽ mở rộng cung cấp cho các đối tác bên ngoài.
Hiện nay có hơn 10 triệu người thường xuyên sử dụng các dịch vụ AI trong Zalo. Con số này sẽ liên tục tăng trong thời gian tới.
Trong 3 thách thức ban đầu: nhân sự, phần cứng và dữ liệu thì hiện tại con người không còn là vấn đề lớn nhất nữa. Thực tế, người Việt Nam rất thông minh, nhạy bén nên chúng ta có lợi thế trong việc nhanh chóng nắm bắt các xu hướng công nghệ mới. Tuy nhiên, 2 vấn đề còn lại thực sự là rất khó vượt qua.
Về phần cứng, trong vòng 15 tháng vừa qua, giá trị Nvidia - công ty sản xuất chip AI đã tăng gấp 5 lần, tới hơn 3.000 tỷ USD. Điều này cho thấy cả thế giới đang “khát” chip AI như thế nào. Đây là thách thức rất lớn đối với các đơn vị muốn nghiên cứu AI nghiêm túc. Để làm chủ công nghệ, phải đầu tư tối thiểu nhiều triệu USD thì mới có được hạ tầng cơ bản để huấn luyện AI. Thế nhưng, ngoài việc huy động nguồn tiền để đầu tư hạ tầng, giờ chúng ta còn phải vượt thêm rào cản về giới hạn xuất khẩu chip AI của Mỹ, mới ban hành tháng 10/2023.
Zalo AI đã may mắn khi sớm quyết tâm đầu tư, xây dựng được cluster 64 card Nvidia H100 trước khi Mỹ đưa ra lệnh giới hạn xuất khẩu. Tuy nhiên về lâu dài, nguồn chip sẽ là một hạn chế nghiêm trọng cho khát vọng tự chủ AI của các công ty Việt Nam. Thêm vào đó, các đại học Việt Nam cũng sẽ gặp khó khăn khi không có đủ thiết bị để đào tạo sinh viên AI nghiên cứu cơ bản. Không giống như một chiếc điện thoại giá chỉ vài chục triệu đồng, máy chủ huấn luyện AI trị giá hàng trăm nghìn USD và là câu chuyện rất khác.
Về dữ liệu, trước đây những bài toán học máy đã đòi hỏi lượng dữ liệu huấn luyện lớn, nhưng đến những mô hình ngôn ngữ lớn thì cần một lượng dữ liệu khổng lồ. Lựa chọn của Zalo AI là đầu tư sâu ngôn ngữ tiếng Việt. Thế nhưng khi đi tìm dữ liệu để huấn luyện AI, chúng tôi mới phát hiện là lượng văn bản tiếng Việt cực kỳ ít khi so sánh với tiếng Anh.
Hầu hết các tài liệu trên Internet đều được xuất bản bằng tiếng Anh, và số lượng văn bản ngôn ngữ khác đều là số lẻ nếu so với ngôn ngữ toàn cầu này. Vì thế, rất khó huấn luyện các mô hình ngôn ngữ địa phương để đạt được khả năng viết lách, lý luận như AI tiếng Anh.
Hai thách thức này, cả máy móc và dữ liệu, đều khó có thể dùng nỗ lực để vượt qua được.
Góc nhìn như vậy có bi quan không?
Tôi chỉ nói đó là những khó khăn thôi, còn vẫn tìm cách để “chạy thi” với các bạn Tây (các công ty lớn về AI trên thế giới -PV). Về nguyên tắc, chúng ta không cần và không nên chạy đua trực tiếp về mặt công nghệ, mà phải tìm được một số ngách ứng dụng đủ hẹp mà Việt Nam có thể tập trung tối ưu và làm tốt hơn nước ngoài.
Thêm nữa, công nghệ luôn cải tiến và chi phí cho phần cứng dần dần sẽ giảm xuống theo thời gian. Về dữ liệu huấn luyện, dù văn bản tiếng Việt không phong phú được như tiếng Anh thì rồi chúng ta sẽ tìm ra giải pháp trong tương lai thôi.
Hội thảo Zalo AI Summit không được đầu tư về học thuật, vì đó không phải là điểm mạnh của cá nhân tôi cũng như tổ chức mà tôi xây dựng. Tuy nhiên, diễn đàn này nổi tiếng về mức độ thực dụng, về các bài toán mang tính thực tế, và với dữ liệu huấn luyện chất lượng cao. Dữ liệu huấn luyện là thứ mà các nhóm nghiên cứu AI đều rất quan tâm.
Còn về câu chuyện phát triển AI, tôi nghĩ là nên chia thành nhiều tầng. Ở tầng nghiên cứu cơ bản, đó là chuyện khó. Khoảng cách với các tập đoàn, viện nghiên cứu nước ngoài là rất xa. Dù rào cản sẽ giảm dần theo thời gian, nhưng để Việt Nam có đột phá về nghiên cứu AI cơ bản tôi nghĩ sẽ khó khăn. Đây là cuộc chơi của các “tay to” đẳng cấp thế giới.
Nhưng về mặt phát triển ứng dụng AI thì tôi lại khá lạc quan, và có niềm tin là người Việt Nam mình chẳng thua ai, không chỉ làm ứng dụng nội địa mà còn xuất khẩu ra thế giới. Các nền tảng mobile Android và iOS đã tạo ra làn sóng người Việt xuất khẩu game, ứng dụng ra nước ngoài, như game Flappy Bird, ứng dụng Money Lover… Tôi tin rằng chúng ta sẽ tiếp tục có những câu chuyện thành công tương tự với AI
Ở Zalo, chúng tôi thích làm việc khó và có niềm tin ngây thơ là mình sẽ làm được. Khẩu hiệu của chúng tôi là “Embracing challenges - Đón nhận thách thức”, chúng tôi thích thách thức và cảm giác mình lớn lên cùng những bài toán khó đó.
Còn khi tiếp cận, chúng tôi tránh không cạnh tranh trực tiếp với điểm mạnh của những người khổng lồ Silicon Valley. Phải đi tìm ngách khác biệt mà mình có lợi thế, đồng thời đem lại giá trị quan trọng cho người dùng. Sau đó, chúng tôi tập trung toàn lực cho sự khác biệt đó, tạo sự hữu ích vượt trội so với các sản phẩm khác. Zalo là ví dụ điển hình khi chúng tôi kiên trì tập trung giúp người dùng nhắn tin nhanh và ổn định nhất, và lần lượt vượt qua các OTT nước ngoài với vô số tính năng hoành tráng.
Luôn tham gia phát triển các sản phẩm world-class, phải cạnh tranh với những người khổng lồ công nghệ thế giới và họ cũng là những người liên tục tạo ra những sáng tạo đột phá làm thay đổi ngành. Anh đã làm như thế nào để giữ cho mình theo kịp với sự thay đổi nhanh chóng của ngành công nghệ?
Trong lĩnh vực công nghệ, dù cách tiếp cận liên tục cập nhật nhưng các nguyên tắc cơ bản thì lại ít thay đổi. Đến giờ tôi vẫn trực tiếp ra các quyết định kỹ thuật, vì các nguyên tắc của ngành khoa học máy tính vẫn không đổi sau nhiều năm. AI cũng không ngoại lệ, đây chỉ là một phân ngành của khoa học máy tính.
Tôi thường lấy ví dụ về leo núi để giải thích với các kỹ sư Zalo. Các kỹ năng cơ bản của leo núi như rèn luyện sức khỏe, chuẩn bị trang bị, đọc hiểu bản đồ, nguyên tắc cắm trại… thường không thay đổi, dù mỗi quả núi mỗi cung đường thì khác biệt rất nhiều.
Cái này cũng liên quan đến cách chúng tôi tuyển dụng các bạn trẻ vào làm ở Zalo: điểm ở trường phải cao. Điều này chứng tỏ các bạn nắm vững các nguyên tắc, còn kỹ năng chi tiết chúng tôi sẽ đào tạo sau. Một số bạn được tuyển dụng vào ở vị trí quản lý đôi khi sẽ ngạc nhiên bởi nhiều câu hỏi phỏng vấn quá đơn giản, đến mức các bạn coi là người hỏi thiếu tôn trọng.
Thế nhưng, chúng tôi chỉ quan tâm đến những nguyên tắc cơ bản vậy thôi. Nếu làm ở Zalo, các bạn ấy sẽ phải quên đi một số kiến thức cũ và học thêm nhiều cái mới, còn nguyên tắc thì không thay đổi.
Hiện tại, Zalo AI bắt đầu gặt hái những thành công rõ ràng đầu tiên, nhưng anh có nghĩ tới việc mình sẽ bị làn sóng công nghệ kế tiếp thay thế?
Công nghệ là môi trường rất khắc nghiệt và liên tục có những làn sóng mới phủ định tất cả. Khoảng mỗi 10 năm sẽ có một lần thay thế như vậy. Tôi nghĩ đây là sự lựa chọn. Nếu chọn nhàn hạ thì nên chấp nhận dần bị phủ định, còn không thì phải liên tục chuẩn bị cho thay đổi sắp tới. Tôi thường chia sẻ làm công nghệ thì cũng giống như leo núi. Lúc leo thì rất mệt nhưng vui, còn ở lại chân núi thì cũng… buồn. Hàng năm, đội ngũ quản lý Zalo hơn 50 người đều kéo nhau đi leo núi để duy trì tinh thần này.
Khi đứng trước một ngọn núi mới, thường tôi cũng không tự tin, chỉ biết dựa vào vài kinh nghiệm trước đó và niềm tin rằng mình cũng có thể chinh phục ngọn núi này. Vì thế, nếu hỏi công thức rõ ràng để chuẩn bị leo núi thành công thì có lẽ không có. Cá nhân tôi hay nghĩ đơn giản theo kiểu, mỗi năm có cả nghìn người lên đỉnh Everest nên chắc cố thì mình cũng leo được (cười). Và trực giác của một kỹ sư, cùng sự lạc quan tự nhiên, thúc đẩy tôi tiếp tục theo đuổi làn sóng công nghệ tiếp theo.
Bài:
Bình Minh - Hoàng Ly
Thiết kế:
Hương Xuân