DeepSeek lần đầu thông báo tuyển dụng vị trí liên quan đến sản phẩm, rục rịch ra mắt mô hình AI mới

4 giờ trước Gốc

DeepSeek khởi động chiến dịch tuyển dụng khẩn cấp các vị trí liên quan đến 'sản phẩm và thiết kế' tại thủ đô Bắc Kinh và thành phố Hàng Châu, làm dấy lên đồn đoán về mô hình AI mới mà công ty khởi nghiệp Trung Quốc này vẫn giữ kín thông tin.

Thông báo tuyển dụng cho biết ứng viên sẽ tham gia xây dựng “trải nghiệm sản phẩm thông minh thế hệ tiếp theo” dựa trên mô hình ngôn ngữ lớn, theo tài khoản WeChat chính thức của DeepSeek. Mô hình ngôn ngữ lớn là công nghệ nền tảng cho các dịch vụ AI tạo sinh như ChatGPT và ứng dụng chatbot cùng tên của DeepSeek.

DeepSeek được sáng lập bởi doanh nhân công nghệ Lương Văn Phong vào năm 2023. Đây là lần đầu tiên DeepSeek thông báo tuyển dụng các vị trí như quản lý và thiết kế sản phẩm, thiết kế trực quan. Trước đó, công ty có trụ sở tại Hàng Châu chủ yếu tập trung vào nghiên cứu mô hình AI nền tảng.

Thiết kế trực quan là lĩnh vực thuộc thiết kế giao diện và trải nghiệm người dùng, tập trung vào hình thức trực quan của sản phẩm kỹ thuật số như ứng dụng, website, phần mềm,...

Chiến dịch tuyển dụng này cho thấy DeepSeek đang chuyển mình thành một tổ chức doanh nghiệp thực thụ (tức là công ty hoạt động chuyên nghiệp, có cấu trúc rõ ràng, vận hành bài bản như các doanh nghiệp lớn).

DeepSeek cũng đang trong quá trình tuyển dụng giám đốc tài chính (CFO), giám đốc vận hành (COO) cùng bốn vị trí khác ở lĩnh vực nghiên cứu và kỹ thuật, theo trang web tuyển dụng của họ.

DeepSeek đang chuyển mình thành doanh nghiệp công nghệ toàn diện - Ảnh: Shutterstock

Dù nhận được sự quan tâm lớn từ công chúng và giới đầu tư, DeepSeek vẫn khá kín tiếng, chỉ đưa ra một số cập nhật sản phẩm và công bố vài bài nghiên cứu. Bản nâng cấp mô hình ngôn ngữ lớn gần nhất của DeepSeek là vào ngày 25.3, khi công ty tung ra phiên bản cải tiến cho mô hình mã nguồn mở V3.

Mô hình mới DeepSeek-V3-0324 được phát hành trên nền tảng phát triển Hugging Face, đánh dấu bước tiến mới nhất của công ty này trong nỗ lực khẳng định vị thế trên thị trường AI đang phát triển nhanh chóng.

DeepSeek-V3-0324 mang lại những cải thiện đáng kể về khả năng lập luận và lập trình so với các mô hình trước đó. Các bài kiểm tra tiêu chuẩn cho thấy hiệu suất của nó được cải thiện trên nhiều chỉ số kỹ thuật được công bố trên Hugging Face.

Theo nguồn tin của Reuters, DeepSeek có thể ra mắt mô hình suy luận mới R2 đầu tháng 5 tới, nhưng công ty vẫn chưa công bố bất kỳ thông tin nào liên quan đến tiến độ phát hành này.

DeepSeek đã thu hút sự chú ý toàn cầu từ cuối tháng 12.2024 đến tháng 1.2025 khi lần lượt tung ra hai mô hình AI mã nguồn mở tiên tiến là V3 và R1, được phát triển với chi phí chỉ bằng một phần nhỏ so với dự án mô hình ngôn ngữ lớn của các gã khổng lồ công nghệ. Những thông báo này đã gây chấn động cả Phố Wall lẫn Thung lũng Silicon.

Trong một bài viết, DeepSeek tiết lộ đào tạo V3 chỉ bằng 2.048 GPU (bộ xử lý đồ họa) Nvidia H800 khoảng hai tháng. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

DeepSeek tuyên bố quá trình huấn luyện V3 chỉ tiêu tốn 2,8 triệu giờ GPU với chi phí 5,6 triệu USD, bằng một phần nhỏ thời gian và tiền bạc mà các công ty Mỹ bỏ ra cho các mô hình AI của họ.

Làn sóng phát triển các sản phẩm dựa trên công nghệ của DeepSeek

Nhiều doanh nghiệp công nghệ Trung Quốc đã nhanh chóng phát triển các sản phẩm dựa trên mô hình AI mã nguồn mở của DeepSeek, đặc biệt là R1 (được công bố vào tháng 1).

Ông Lý Khai Phục, nhà sáng lập kiêm Giám đốc điều hành 01.AI (Trung Quốc), tháng trước cho biết công ty khởi nghiệp của ông đang tận dụng công nghệ DeepSeek để cung cấp giải pháp AI cho khách hàng doanh nghiệp, nhất là trong các lĩnh vực tài chính, game và pháp lý. 01.AI thậm chí đã ngừng phát triển mô hình AI riêng để tập trung vào công nghệ của DeepSeek.

Trong khi đó, các nhà nghiên cứu, nhà đầu tư và công chúng đang theo dõi sát sao cách mà DeepSeek có thể tiếp tục tạo ra đột phá giữa bối cảnh Mỹ siết chặt lệnh cấm xuất khẩu chip AI tiên tiến của Nvidia sang Trung Quốc.

Theo trang Financial Times, ông Hoàng Nhân Huân (Giám đốc điều hành Nvidia) đã có cuộc gặp với Lương Văn Phong trong chuyến thăm Trung Quốc tuần trước. Tuy nhiên, cả Nvidia và DeepSeek đều chưa xác nhận liệu cuộc gặp này có diễn ra hay không.

Lý Khai Phục nói DeepSeek giúp Trung Quốc rút ngắn khoảng cách phát triển AI với Mỹ xuống chỉ còn ba tháng trong một số lĩnh vực - Ảnh: SCMP

Lý Khai Phục, nhân vật có tầm ảnh hưởng trong lĩnh vực AI toàn cầu và từng là Chủ tịch Google Trung Quốc, nói với Reuters rằng DeepSeek đã giúp Trung Quốc vượt lên trong một số lĩnh vực như kỹ thuật phần mềm hạ tầng.

Theo Lý Khai Phục, Trung Quốc đã rút ngắn khoảng cách phát triển AI với Mỹ xuống chỉ còn ba tháng trong một số lĩnh vực, nhờ các công ty như DeepSeek tối ưu hóa việc sử dụng chip và áp dụng thuật toán hiệu quả hơn.

"Trước đây, tôi nghĩ rằng khoảng cách là từ 6 đến 9 tháng và Trung Quốc thua kém ở mọi mặt. Song bây giờ, tôi tin rằng có lẽ Trung Quốc chỉ chậm hơn Mỹ khoảng 3 tháng trong một số công nghệ cốt lõi, nhưng thực tế lại đang dẫn trước ở một số lĩnh vực cụ thể", Lý Khai Phục chia sẻ với Reuters.

Ông cho rằng các lệnh trừng phạt về chất bán dẫn của Mỹ là "con dao hai lưỡi", gây ra khó khăn trong ngắn hạn nhưng cũng buộc các công ty Trung Quốc phải đổi mới trong điều kiện hạn chế, đặc biệt về việc phát triển thuật toán.

"Việc DeepSeek có thể tìm ra chuỗi tư duy mới để cải tiến học tăng cường cho thấy họ đang bắt kịp Mỹ rất nhanh, hoặc thậm chí còn sáng tạo hơn", Lý Khai Phục nhận định, đề cập đến khả năng của mô hình DeepSeek trong việc hiển thị quá trình suy luận trước khi đưa ra câu trả lời. Đây là tính năng mà OpenAI từng phát triển.

Học tăng cường là phương pháp học máy, trong đó một tác nhân học cách đưa ra quyết định bằng cách tương tác với môi trường và nhận phản hồi dưới dạng phần thưởng hoặc hình phạt. Mục tiêu của học tăng cường là giúp tác nhân tối đa hóa phần thưởng dài hạn thông qua các hành động mà nó thực hiện trong môi trường.

Ứng dụng của học tăng cường

Chơi game: Học tăng cường đã được sử dụng để huấn luyện các hệ thống AI chơi game, chẳng hạn AlphaGo của Google DeepMind.

Robot: Điều khiển robot để học cách thực hiện các tác vụ phức tạp như di chuyển hoặc thu thập vật phẩm.

Tối ưu hóa: Ứng dụng trong các lĩnh vực như quảng cáo, tài chính và quản lý tài nguyên để tối đa hóa lợi nhuận hoặc hiệu quả.

Ô tô tự lái: Học tăng cường giúp ô tô tự lái học cách điều khiển an toàn trong môi trường giao thông phức tạp.

Ngành công nghệ Trung Quốc đã bước vào cuộc đua AI toàn cầu sau khi OpenAI ra mắt ChatGPT vào cuối năm 2022. Song trước khi DeepSeek xuất hiện, nhiều chuyên gia Trung Quốc vẫn cho rằng họ còn khoảng cách xa so với các đối thủ phương Tây.

Là nhà sáng lập quỹ đầu tư mạo hiểm Sinovation Ventures, Lý Khai Phục đã thành lập 01.AI vào tháng 3.2023, tham gia cùng các công ty AI mới nổi như ZhipuAI, Moonshot cũng như gã khổng lồ công nghệ Baidu, Alibaba, ByteDance trong cuộc đua xây dựng mô hình AI nền tảng.

Tuy nhiên, Lý Khai Phục cho rằng đầu tư vào các mô hình AI độc quyền ngày càng trở nên "đầy thách thức" khi thị trường bị thống trị bởi các tập đoàn công nghệ lớn có nguồn vốn dồi dào và sự cạnh tranh từ những mô hình mã nguồn mở phát triển nhanh chóng.

01.AI tập trung vào các ứng dụng AI thực tiễn - các giải pháp phần mềm giúp khách hàng triển khai hiệu quả các mô hình nền tảng.

Đầu tháng 1, 01.AI đã ra mắt Wanzhi, nền tảng phần mềm mới hỗ trợ doanh nghiệp triển khai công nghệ AI. Công ty đã bắt đầu tạo ra doanh thu và dự kiến tăng trưởng trong năm 2025 sẽ cao gấp nhiều lần so với mức 15 triệu USD đạt được vào 2024, Lý Khai Phục cho biết.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/deepseek-lan-dau-thong-bao-tuyen-dung-vi-tri-lien-quan-den-san-pham-ruc-rich-ra-mat-mo-hinh-ai-moi-231917.html