'Vũ khí bí mật' giúp Trung Quốc cạnh tranh Mỹ trong cuộc đua AI

13 giờ trước Gốc

Từng gây tiếng vang với mô hình AI mạnh mẽ, startup AI DeepSeek đang dùng 'thiên tài trẻ' để cạnh tranh với các tập đoàn Mỹ.

DeepSeek đang tỏ ra là đối thủ "đáng gờm" của ChatGPT hay Gemini. Ảnh: SCMP.

Hôm 26/12, startup trí tuệ nhân tạo (AI) Trung Quốc DeepSeek ra mắt mô hình ngôn ngữ lớn (LLM) DeepSeek V3. Mặc dù được đào tạo với nguồn lực hạn chế, mô hình này vẫn đạt được hiệu suất tương đương, thậm chí vượt trội ở một số khía cạnh so với các đối thủ lớn đến từ Mỹ như Meta và OpenAI.

Đây được coi là một bước đột phá quan trọng, mở ra cơ hội cho Trung Quốc vượt qua Mỹ về năng lực AI, bất chấp những hạn chế về tiếp cận chip tiên tiến và nguồn vốn.

Theo các nguồn thông tin từ báo cáo kỹ thuật, các trang web tuyển dụng, các cuộc phỏng vấn với cựu nhân viên và các bài báo địa phương, có thể thấy bước đột phá này là thành quả của một nhà sáng lập kín tiếng và đội ngũ nghiên cứu trẻ tuổi.

Năm 2023, DeepSeek được tách ra từ quỹ đầu cơ High Flyer-Quant. Nhà sáng lập High-Flyer Quant, Liang Wenfeng, cũng chính là người đứng sau DeepSeek, từng được đào tạo về AI tại Đại học Chiết Giang.

Chính sách trọng dụng nhân tài trẻ của DeepSeek đã tỏ ra hiệu quả khi gặt hái được thành công với nguồn vốn hạn chế. Ảnh: ShutterStock.

Theo tiết lộ của ông Liang trong cuộc phỏng vấn với trang tin trực tuyến 36Kr hồi tháng 5/2023, DeepSeek ưu tiên tuyển dụng những nhân sự trẻ trong lĩnh vực AI, từ sinh viên mới ra trường đến những người mới bắt đầu sự nghiệp. Chính sách này thể hiện rõ quan điểm trọng dụng năng lực hơn kinh nghiệm của công ty.

"Các vị trí kỹ thuật cốt lõi của chúng tôi chủ yếu được đảm nhiệm bởi sinh viên mới tốt nghiệp hoặc những người chỉ có một hoặc hai năm kinh nghiệm làm việc", ông Liang cho biết.

Trong số các nhân tài tại DeepSeek, Gao Huazuo và Zeng Wangding được công ty đặc biệt ghi nhận vì những đóng góp quan trọng trong việc nghiên cứu và phát triển kiến trúc MLA.

Gao tốt nghiệp Đại học Bắc Kinh (PKU) năm 2017 với bằng vật lý, trong khi Zeng bắt đầu học thạc sĩ tại Viện AI thuộc Đại học Bưu chính Viễn thông Bắc Kinh vào năm 2021.

Cả hai hồ sơ đều cho thấy cách tiếp cận khác biệt của DeepSeek đối với nhân tài, vì hầu hết công ty khởi nghiệp AI địa phương đều thích thuê các nhà nghiên cứu có kinh nghiệm và thành danh hơn hoặc các tiến sĩ được đào tạo ở nước ngoài chuyên về khoa học máy tính.

Các thành viên chủ chốt của DeepSeek còn có sự góp mặt của Guo Daya, tiến sĩ mới tốt nghiệp Đại học Tôn Trung Sơn năm 2023, và hai tiến sĩ trẻ khác là Zhu Qihao và Dai Damai, đều đến từ Đại học Bắc Kinh (PKU).

Cựu nhân tài trẻ tuổi của DeepSeek, Luo Fuli. Ảnh: Luo Fuli.

Bên cạnh đó còn có cựu nhân viên Luo Fuli, một trong những tài năng được biết đến nhiều nhất của DeepSeek. Với bằng thạc sĩ từ Đại học Bắc Kinh (PKU), cô được truyền thông Trung Quốc ca ngợi là "thần đồng AI".

Cô đã thu hút sự chú ý của dư luận sau khi có thông tin cho rằng nhà sáng lập Xiaomi, Lei Jun, đã đề nghị mức lương 1,4 triệu USD/năm để mời cô về làm việc.

Mô hình V3 của DeepSeek được đào tạo trong vòng hai tháng, sử dụng khoảng 2.000 chip Nvidia H800 với tổng chi phí chỉ 6 triệu USD. Andrej Karpathy, một trong những nhà sáng lập OpenAI, đã nhận xét đây là một "ngân sách đùa", ngụ ý chi phí quá thấp so với quy mô dự án.

Cách đây 2 tuần, nhiều người dùng phản hồi DeepSeek V3 ngộ nhận mình là ChatGPT. Tuy vậy, các chuyên gia đánh giá rằng việc một mô hình AI tự nhận là ChatGPT không phải điều xa lạ trong lĩnh vực trí tuệ nhân tạo vì đa số công cụ chatbot hiện tại đều được đào tạo từ nguồn dữ liệu chung.

Việt Anh

Nguồn Znews: https://znews.vn/vu-khi-bi-mat-giup-trung-quoc-canh-tranh-my-trong-cuoc-dua-ai-post1524581.html