Nhóm nhà khoa học gốc Trung của xAI giúp Elon Musk tạo ra Grok-3 để đấu với DeepSeek và các hãng Trung Quốc
Truyền thông Trung Quốc đang chú ý đến số lượng lớn các nhà phát triển, nhà nghiên cứu và nhà khoa học quan trọng của xAI sinh ra và được đào tạo tại quốc gia châu Á này nhưng làm việc ở Mỹ.
Sau khi xAI ra mắt mô hình trí tuệ nhân tạo (AI) mới nhất Grok-3 hôm 18.2, sự hiện diện của số lượng lớn nhà phát triển người Trung Quốc tại công ty khởi nghiệp do Elon Musk điều hành thu hút sự chú ý.
Các công ty Mỹ và Trung Quốc gần đây thường xuyên tung ra mô hình mới trong cuộc cạnh tranh khốc liệt về AI. Bên chiến thắng trong cuộc đua AI toàn cầu có thể được quyết định bởi nỗ lực của các nhà khoa học máy tính và kỹ sư người Trung Quốc ở cả hai phía.
Tại buổi livestream trên mạng xã hội X, Elon Musk cho biết Grok-3 vượt trội hơn mô hình ngôn ngữ lớn V3 của DeepSeek (Trung Quốc), Google Gemini, Claude 3.5 của Anthropic, GPT-4o của OpenAI (Mỹ) trong các bài kiểm tra khoa học, toán học và lập trình.
Truyền thông Trung Quốc nhanh chóng chú ý và đăng tải bài viết nêu bật tài năng của những người Trung Quốc trong đội ngũ xAI, gồm cả một thành viên quan trọng từng theo học tại Đại học Chiết Giang. Đó cũng là nơi mà Liang Wenfeng (người sáng lập kiêm Giám đốc điều hành DeepSeek) từng học.
Khoảng 1/3 thành viên sáng lập xAI được cho có nguồn gốc Trung Quốc, trong đó có hai người xuất hiện trong buổi livestream để giới thiệu Grok-3 với thế giới.
"Yêu đội ngũ kỹ sư quốc tế của Elon. Tôi nghĩ mình nghe thấy tiếng Đức, tiếng Trung và tiếng Mỹ", Nina Schick (tác giả và doanh nhân về AI) đăng trên X hôm 18.2.
Nhiều bài đăng trên X cũng có quan điểm tương tự. Tài khoản X có nickname seclink với hơn 20.000 người theo dõi viết bài bằng tiếng Trung rằng trong lĩnh vực mô hình ngôn ngữ lớn, "một nhóm người Trung Quốc ở Mỹ và một nhóm người Trung Quốc ở quê nhà đang cạnh tranh với nhau".
Vào năm 2022, Trung Quốc là quê hương của 38% nhà nghiên cứu AI hàng đầu làm việc tại Mỹ, so với 37% đến từ Mỹ, theo MacroPolo Global AI Talent Tracker (công cụ do Viện Paulson tại thành phố Chicago phát triển để theo dõi và phân tích nguồn nhân lực AI toàn cầu).
Liang Wenfeng đã tốt nghiệp cử nhân và thạc sĩ ngành Kỹ thuật tại Đại học Chiết Giang thuộc thành phố Hàng Châu (Trung Quốc).
Khi xAI được giới thiệu vào năm 2023, nhà nghiên cứu Zhang Guodong (tốt nghiệp cử nhân ngành Kỹ thuật Thông tin tại Đại học Chiết Giang năm 2017) là 1 trong 12 thành viên sáng lập.
Zhang Guodong chuyển đến Canada để theo đuổi bằng tiến sĩ về học máy tại Đại học Toronto, đồng thời làm thực tập sinh nghiên cứu ở Google Brain và DeepMind, nơi anh trở thành nhà khoa học nghiên cứu toàn thời gian sau khi tốt nghiệp năm 2022. Khi còn là sinh viên đại học, Zhang Guodong đã giành chiến thắng trong các cuộc thi mô hình hóa ở cả Trung Quốc và quốc tế, nơi các thí sinh phải giải quyết các vấn đề ứng dụng mở.
Zhang Guodong là trưởng nhóm tiền huấn luyện tại xAI, phụ trách giai đoạn đầu của quá trình đào tạo mô hình AI với lượng dữ liệu lớn để học tập tổng quát. Sau khi Grok-3 được công bố, Zhang Guodong đăng trên X: "Trong khi hầu hết công ty chỉ tập trung vào trí thông minh hoặc hiệu suất, chúng tôi muốn cả hai".
Jimmy Ba và Yuhuai "Tony" Wu, hai thành viên sáng lập xAI khác, cũng từng theo học tại Đại học Toronto. Cả hai đều từng cùng Zhang Guodong viết các bài báo nghiên cứu riêng biệt.
Cả Jimmy Ba và Yuhuai "Tony" Wu đều xuất hiện trong buổi livestream ra mắt Grok-3 cùng Elon Musk và kỹ sư trưởng Igor Babuschkin.

Elon Musk (phải), Jimmy Ba, Yuhuai “Tony” Wu và Igor Babuschkin (trái) trong buổi livestream giới thiệu Grok-3
Jimmy Ba từng là học trò của Geoffrey Hinton, nhà tiên phong trong lĩnh vực AI và là một trong những học giả hàng đầu về công nghệ này. Trong khi đó, Yuhuai "Tony" Wu là nhà phát triển lõi của Grok với mối quan tâm đặc biệt đến toán học AI và xây dựng máy móc có khả năng lập luận.
Đội ngũ sáng lập xAI còn có cả nhà toán học Greg Yang, sinh ra ở tỉnh Hồ Nam, miền trung Trung Quốc và chuyển đến Mỹ khi còn học trung học. Greg Yang tốt nghiệp Đại học Harvard (Mỹ) trước khi làm việc tại Microsoft Research với trọng tâm là AI và khoa học máy tính lý thuyết.
Greg Yang từng nhận được đề cử danh dự về nghiên cứu toán học xuất sắc dành cho sinh viên đại học trong Giải thưởng Morgan năm 2018. Đây là giải thưởng thường niên dành cho nghiên cứu toán học xuất sắc.
Zihang Dai, thành viên sáng lập khác của xAI và cựu nhà nghiên cứu Google, từng nhận bằng cử nhân quản trị kinh doanh tại Đại học Thanh Hoa vào năm 2013 trước khi trở thành thực tập sinh ở Viện Học sâu Baidu. Sau đó, Zihang Dai chuyển đến Mỹ để theo học tại Đại học Carnegie Mellon (bang Pennsylvania) và nhận bằng tiến sĩ khoa học máy tính năm 2020.
Ngoài các thành viên sáng lập, một số nhân sự kỹ thuật khác tại xAI cũng đến từ Trung Quốc, theo trang SCMP. Vài người trong số họ từng làm việc tại Google và Microsoft trước khi gia nhập xAI.
Juntang Zhuang gia nhập xAI với tư cách là nhân viên kỹ thuật vào tháng 1.2024 sau khi rời vị trí toàn thời gian tại OpenAI, nơi anh từng là đồng tác giả mô hình ngôn ngữ lớn GPT-4.
Juntang Zhuang, trưởng nhóm mô hình Grok-2 và Grok-3 mini, đã nhận bằng cử nhân kỹ thuật tại Đại học Thanh Hoa và bằng tiến sĩ kỹ thuật y sinh ở Đại học Yale (Mỹ) vào năm 2022.
Xiao Sun, nhân viên kỹ thuật tại xAI từ tháng 9.2023, đã nhận bằng cử nhân về vi điện tử tại Đại học Bắc Kinh (Trung Quốc) trước khi có bằng tiến sĩ kỹ thuật điện và điện tử tại Đại học Yale vào năm 2012. Xiao Sun từng là nhà nghiên cứu tại IBM trong hơn 6 năm, sau đó là nhà khoa học nghiên cứu ở Meta Platforms trước khi gia nhập xAI.
Nhân viên kỹ thuật Lianmin Zheng gia nhập xAI vào tháng 3.2024 và nhận bằng tiến sĩ khoa học máy tính tại Đại học California Berkeley (Mỹ) cùng năm. Anh từng tốt nghiệp ngành khoa học máy tính tại Đại học Giao thông Thượng Hải vào năm 2019.
Elon Musk là một người ủng hộ mạnh mẽ chương trình thị thực H-1B, cho phép lao động nước ngoài có tay nghề cao làm việc tại Mỹ. Trong một bài đăng trên X vào tháng 12.2024, Elon Musk nói rằng những cá nhân "quan trọng" như chính ông có thể ở Mỹ nhờ vào thị thực này.
Trong nhiệm kỳ Tổng thống Mỹ đầu tiên, Donald Trump không ủng hộ chương trình thị thực này mà ông gọi là "không công bằng" với lao động Mỹ. Quan điểm của Tổng thống Trump về chương trình này trong nhiệm kỳ thứ hai vẫn chưa được công bố chính thức, dù ông từng nói ủng hộ thị thực H-1B.
Hôm 18.2, Elon Musk cho biết trong một bài thuyết trình cùng ba kỹ sư xAI rằng Grok-3 có sức mạnh tính toán "gấp hơn 10 lần" so với phiên bản cũ và đã hoàn thành quá trình huấn luyện sơ bộ vào đầu tháng 1.
"Chúng tôi liên tục cải tiến mô hình mỗi ngày, và chỉ trong vòng 24 giờ, bạn sẽ thấy sự cải thiện", tỷ phú giàu nhất thế giới nói.
Elon Musk cho biết xAI đã sử dụng một kỹ thuật mới nhằm giảm thời gian huấn luyện nhưng vẫn đạt được mô hình AI hiệu suất cao. Khác với DeepSeek-R1, Grok-3 sẽ không hiển thị suy luận trong quá trình giải quyết truy vấn của người dùng. Elon Musk nói rằng biện pháp này nhằm ngăn các công ty khác sao chép mô hình của xAI.
Trước đó, hôm 13.2, Elon Musk phát biểu trong một cuộc gọi video tại Hội nghị Thượng đỉnh các Chính phủ Thế giới ở Dubai (UAE): "Grok-3 có khả năng suy luận rất mạnh mẽ. Trong các thử nghiệm mà chúng tôi thực hiện cho đến nay, Grok-3 đang vượt trội hơn bất kỳ thứ gì đã được phát hành mà chúng tôi biết. Đó là một dấu hiệu tốt".
Hôm 18.2, xAI còn giới thiệu DeepSearch, công cụ tìm kiếm thông minh mới.
DeepSearch là chatbot suy luận, thể hiện quá trình hiểu một truy vấn và cách lập kế hoạch để phản hồi. Theo xAI, DeepSearch có các tùy chọn hỗ trợ nghiên cứu, động não và phân tích dữ liệu.
Nhóm kỹ sư xAI cho biết: "Đây thực sự là tính năng giúp tiết kiệm thời gian. Những thứ trước đây mất nửa hay thậm chí 1 tiếng để nghiên cứu trên web, mạng xã hội thì bây giờ chỉ cần nhờ AI đi tìm, chỉ mất khoảng 10 phút. Đó là khả năng của DeepSearch và thực sự nó làm việc đó tốt hơn bạn".
Grok-3 đã được triển khai ngay lập tức cho người đăng ký gói Premium+ trên mạng xã hội X. Công ty cũng ra mắt gói đăng ký mới có tên SuperGrok dành cho ứng dụng di động Grok và trang web Grok.com.