Thanh niên lái xe suốt 4 ngày để nộp đơn xin việc tại DeepSeek, sẵn sàng làm nhân viên vệ sinh

DeepSeek, công ty khởi nghiệp công nghệ nổi tiếng nhất Trung Quốc, trở thành một trong những điểm đến được yêu thích với những người tìm việc trẻ tuổi trên khắp đất nước, khi đẩy mạnh tuyển dụng nhân tài trong lĩnh vực trí tuệ nhân tạo (AI).

DeepSeek đang tuyển dụng hàng chục vị trí liên quan đến nghiên cứu và phát triển AGI tại trụ sở chính ở thành phố Hàng Châu (thủ phủ tỉnh Chiết Giang, miền đông Trung Quốc) cũng như thủ đô Bắc Kinh, theo trang web của High-Flyer và nhiều trang tuyển dụng. DeepSeek được tách ra vào năm 2023 từ High-Flyer, công ty quản lý quỹ đầu tư.

AGI là dạng AI có khả năng hiểu, học hỏi và thực hiện các nhiệm vụ đa dạng một cách linh hoạt, giống hay vượt trội con người. Không giống AI hẹp, vốn chỉ giỏi trong một lĩnh vực cụ thể (như nhận dạng giọng nói hoặc hình ảnh), AGI có khả năng áp dụng kiến thức và kỹ năng trong nhiều lĩnh vực khác nhau, từ đó giải quyết các vấn đề phức tạp một cách tự chủ và sáng tạo. OpenAI định nghĩa AGI là "một hệ thống có tính tự chủ cao, vượt trội hơn con người ở hầu hết công việc có giá trị kinh tế".

Ngay ngày làm việc đầu tiên sau kỳ nghỉ Tết Nguyên đán, một số người trẻ tuổi đã đến trụ sở DeepSeek với hy vọng được tuyển dụng hoặc thiết lập mối quan hệ hợp tác tiềm năng.

“Nếu có thể gặp họ, tôi muốn hỏi xem họ có ý tưởng nào để phát triển các tác tử AI hay không”, Liu Yuanjie, thanh niên quê Hàng Châu vừa tốt nghiệp ngành tự động hóa, chia sẻ với trang SCMP.

Tác tử AI là hệ thống hoặc chương trình máy tính được thiết kế để thực hiện các tác vụ tự động bằng cách sử dụng AI. Các tác tử AI có khả năng tương tác với môi trường, thu thập thông tin, xử lý dữ liệu, ra quyết định và thực hiện các hành động dựa trên mục tiêu được đặt ra.

Đặc điểm của một tác tử AI

Tự động: Có khả năng hoạt động độc lập mà không cần sự can thiệp của con người trong suốt quá trình xử lý.

Nhận thức môi trường: Có thể cảm nhận hoặc thu thập dữ liệu từ môi trường thông qua các cảm biến, API, hoặc dữ liệu được cung cấp.

Ra quyết định: Dựa trên các thuật toán hoặc mô hình học máy, tác tử AI có thể phân tích dữ liệu và chọn hành động phù hợp.

Hành động: Tác tử thực hiện các hành động cụ thể để đạt được mục tiêu, ví dụ như gửi thông báo, điều khiển thiết bị, hoặc cập nhật dữ liệu.

Các loại tác tử AI phổ biến

Reactive Agent (tác tử phản ứng): Hoạt động dựa trên các quy tắc đơn giản và phản ứng ngay lập tức với những thay đổi trong môi trường.

Goal-based Agent (tác tử dựa trên mục tiêu): Được thiết kế để đạt được một hoặc nhiều mục tiêu cụ thể thông qua việc lập kế hoạch và hành động.

Learning Agent (tác tử học tập): Sử dụng các kỹ thuật học máy để tự cải thiện hiệu suất và khả năng ra quyết định qua thời gian.

Multi-agent Systems (hệ thống đa tác tử): Một nhóm các tác tử AI hoạt động cùng nhau để giải quyết các nhiệm vụ phức tạp.

Ứng dụng của tác tử AI

Trợ lý ảo: Siri, Alexa, Google Assistant.

Tác tử tìm kiếm: Công cụ thu thập dữ liệu và cung cấp thông tin từ internet.

Tự động hóa công việc: Robot xử lý tài liệu, chatbot trả lời khách hàng.

Điều khiển hệ thống: Tác tử AI trong các hệ thống thông minh như nhà thông minh, ô tô tự hành.

Một ứng viên khác, họ Shen, cho biết đã lái xe suốt 4 ngày từ tỉnh Tứ Xuyên (phía tây nam Trung Quốc) đến Hàng Châu để nộp đơn xin việc tại DeepSeek, công ty mà anh gọi là “niềm tự hào của đất nước” vì những thành tựu AI của họ. Shen nói rằng anh sẵn sàng nhận bất kỳ công việc nào tại DeepSeek “dù là nhân viên vệ sinh hay tài xế”.

Mặt tiền tòa nhà văn phòng thương mại ở Hàng Châu, nơi có trụ sở của DeepSeek - Ảnh: SCMP

Mặt tiền tòa nhà văn phòng thương mại ở Hàng Châu, nơi có trụ sở của DeepSeek - Ảnh: SCMP

Thái độ nhiệt tình này từ những người tìm việc trẻ tuổi ở Trung Quốc phản ánh sự ngưỡng mộ dành cho DeepSeek, đặc biệt sau khi công ty này gần đây ra mắt hai mô hình AI nguồn mở mạnh mẽ V3 và R1.

V3 và R1 được DeepSeek xây dựng với chi phí và tài nguyên tính toán chỉ bằng một phần nhỏ so với các hãng công nghệ lớn khác khi phát triển mô hình ngôn ngữ lớn (công nghệ nền tảng cho các dịch vụ AI tạo sinh).

Sự quan tâm với DeepSeek dường như đã lên đến đỉnh điểm vào cuối tháng 1 khi chatbot cùng tên với công ty (tích hợp mô hình suy luận R1) đã giành vị trí số một trong số các ứng dụng miễn phí được tải xuống nhiều nhất trên Apple App Store tại Mỹ và Trung Quốc.

Hôm 5.2, ông Hoàng Khôn Minh (Bí thư Tỉnh ủy Quảng Đông) đã ca ngợi DeepSeek vì dám thách thức các gã khổng lồ AI của Mỹ với "sự dũng cảm và quyết tâm". Ông Hoàng Khôn Minh, Ủy viên Bộ Chính trị, là quan chức cấp cao đầu tiên của chính phủ Trung Quốc công khai khen ngợi công ty này.

Danh tiếng ngày càng tăng của DeepSeek chắc chắn giúp ích cho nỗ lực tuyển dụng của công ty trong bối cảnh thị trường lao động Trung Quốc đang gặp nhiều thách thức.

Dù ngành AI bùng nổ tại Trung Quốc có vẻ tạo ra rất nhiều việc làm, nhưng lại không có đủ nhân tài để lấp đầy các vị trí cần tuyển dụng, theo một báo cáo từ Maimai - mạng lưới nghề nghiệp trực tuyến của Trung Quốc tương tự LinkedIn (Mỹ).

Theo bài đăng trên trang tuyển dụng Boss Zhipin (Trung Quốc), vai trò nhà nghiên cứu học sâu trong AGI tại văn phòng Bắc Kinh của DeepSeek hiện cung cấp mức lương hàng tháng lên tới 100.000 nhân dân tệ (13.909 USD) cho các ứng viên có bằng thạc sĩ và những bài viết được xuất bản trên các ấn phẩm đẳng cấp thế giới, không yêu cầu kinh nghiệm làm việc trước đó.

Với các vị trí kỹ sư trong hệ thống học sâu, nghiên cứu dữ liệu và phát triển full-stack, các gói lương của DeepSeek dao động từ 700.000 nhân dân tệ đến 1,2 triệu nhân dân tệ mỗi năm.

Full-stack là thuật ngữ trong lĩnh vực lập trình chỉ những nhà phát triển (full-stack developer) có khả năng làm việc với cả front-end (giao diện người dùng) và back-end (xử lý dữ liệu, máy chủ, cơ sở dữ liệu) của một ứng dụng hoặc trang web.

Trong các bài đăng tuyển dụng của mình, DeepSeek nhấn mạnh lợi thế của công ty về “cụm máy tính xử lý đồ họa hàng đầu” như một điểm thu hút nhân tài AI trẻ tuổi. Công ty cũng hứa hẹn cho các nhà nghiên cứu nhiều quyền tự do hơn để thử nghiệm những ý tưởng khả thi.

Các hồ sơ cho thấy DeepSeek là một trong những đơn vị có nguồn lực mạnh nhất để đào tạo AI. Ngay từ năm 2019, Liang Wenfeng (nhà sáng lập kiêm Giám đốc điều hành DeepSeek) đã chi 200 triệu nhân dân tệ (27,8 triệu USD) để mua 1.100 GPU nhằm đào tạo các thuật toán giao dịch chứng khoán. High-Flyer cho biết trung tâm điện toán của DeepSeek vào thời điểm đó có diện tích tương đương một sân bóng rổ, khoảng 436,6 mét vuông.

Năm 2021, High-Flyer đã chi 1 tỉ nhân dân tệ để phát triển cụm siêu máy tính Fire-Flyer 2, được kỳ vọng đạt công suất 1.550 petaflop, theo trang web của quỹ. Hiệu suất này tương đương với một số siêu máy tính mạnh nhất thế giới.

Trong cuộc phỏng vấn với trang tin công nghệ 36Kr (Trung Quốc) vào tháng 5.2023, Liang Wenfeng cho biết High-Flyer đã mua gần 10.000 GPU Nvidia, gồm cả dòng A100 tiên tiến nhất vào thời điểm đó, trước khi Mỹ áp đặt hạn chế xuất khẩu loại chip này sang Trung Quốc.

Một số nhà phân tích xác định rằng việc High-Flyer chi tiêu mạnh vào phần cứng là yếu tố quan trọng giúp DeepSeek trở thành "ngựa ô" trong cuộc đua AI toàn cầu.

Theo hãng nghiên cứu SemiAnalysis (Mỹ), tổng chi tiêu vốn cho máy chủ của DeepSeek có thể đã lên đến 1,6 tỉ USD với khoảng 50.000 GPU Nvidia Hopper, gồm cả chi phí vận hành 944 triệu USD cho các cụm tính toán.

Có được việc làm tại DeepSeek trở thành mục tiêu của ngày càng nhiều tài năng công nghệ trẻ Trung Quốc - Ảnh: Shutterstock

Có được việc làm tại DeepSeek trở thành mục tiêu của ngày càng nhiều tài năng công nghệ trẻ Trung Quốc - Ảnh: Shutterstock

Nỗ lực tuyển dụng của DeepSeek sẽ làm nóng thêm cuộc chiến giành nhân tài AI trẻ tuổi giữa các hãng công nghệ lớn của Trung Quốc.

Nhu cầu về nhân tài xử lý ngôn ngữ tự nhiên ở Trung Quốc đã tăng 111% trong giai đoạn từ tháng 1 đến tháng 6.2024, theo một báo cáo tháng 11.2024 từ Đại học Bắc Kinh và nền tảng tuyển dụng Zhilian Zhaopin. Trong khi đó, nhu cầu về nhân tài học sâu ở Trung Quốc cũng tăng 61%, theo báo cáo này.

Những “thiên tài trẻ tuổi” của DeepSeek

DeepSeek ghi nhận những “thiên tài trẻ tuổi” trong đội ngũ phát triển của mình là nhân tố đứng sau những thành tựu AI mới nhất của công ty. Nhóm này hầu như chỉ gồm những công dân Trung Quốc đến từ một số trường hàng đầu đất nước, chẳng hạn như Đại học Thanh Hoa và Đại học Bắc Kinh.

Trong cuộc phỏng vấn với 36Kr vào năm 2023, Liang Wenfeng cho biết hầu hết các nhà phát triển tại DeepSeek đều là sinh viên mới tốt nghiệp hoặc những người mới bước chân vào sự nghiệp AI. Điều này phù hợp với tiêu chí tuyển dụng của DeepSeek là đánh giá dựa trên năng lực hơn là kinh nghiệm.

Liang Wenfeng nói: “Các vai trò kỹ thuật cốt lõi của chúng tôi chủ yếu được đảm nhận bởi những sinh viên mới tốt nghiệp hoặc những người chỉ có từ một đến hai năm kinh nghiệm làm việc”.

Trong số các nhân tài AI của DeepSeek, Gao Huazuo và Zeng Wangding là hai người được công ty nêu tên vì đã thực hiện “những đổi mới quan trọng trong nghiên cứu kiến trúc MLA”.

Kiến trúc MLA (Multi-head Latent Attention) là một dạng kiến trúc trong các mô hình AI, đặc biệt là trong các mô hình ngôn ngữ lớn.

Gao Huazuo tốt nghiệp Đại học Bắc Kinh vào năm 2017 với bằng cử nhân vật lý, trong khi Zeng Wangding bắt đầu học thạc sĩ tại Viện AI của Đại học Bưu chính Viễn thông Bắc Kinh năm 2021. Hai hồ sơ này cho thấy cách tiếp cận khác biệt của DeepSeek trong tuyển dụng tài năng, khi phần lớn các công ty khởi nghiệp AI tại Trung Quốc thường ưu tiên tuyển dụng các nhà nghiên cứu có kinh nghiệm hoặc các tiến sĩ được đào tạo ở nước ngoài, chuyên ngành khoa học máy tính.

Những thành viên chủ chốt khác của đội ngũ DeepSeek gồm Guo Daya (tiến sĩ tốt nghiệp năm 2023 tại Đại học Tôn Trung Sơn), Zhu Qihao và Dai Damai (đều là tiến sĩ mới tốt nghiệp từ Đại học Bắc Kinh).

Một trong những tài năng nổi bật nhất của DeepSeek là Luo Fuli. Luo Fuli đã thu hút sự chú ý khi có thông tin Lei Jun (nhà sáng lập kiêm Giám đốc điều hành Xiaomi) từng đề nghị gói lương lên tới 10 triệu nhân dân tệ mỗi năm (1,4 triệu USD) để mời cô làm việc, nhưng thông tin gần đây cho biết cô vẫn chưa chấp nhận lời mời. Tốt nghiệp thạc sĩ tại Đại học Bắc Kinh, Luo Fuli được truyền thông Trung Quốc gọi là “thần đồng AI”.

Theo SemiAnalysis, một số nhà nghiên cứu AI tại DeepSeek kiếm được hơn 1,3 triệu USD/năm, cao hơn mức lương tại nhiều công ty AI hàng đầu khác ở Trung Quốc.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/thanh-nien-lai-xe-suot-4-ngay-de-nop-don-xin-viec-tai-deepseek-san-sang-lam-nhan-vien-ve-sinh-229007.html