Nhiều người lạ tìm đến văn phòng DeepSeek

Văn phòng tại Hàng Châu của DeepSeek gần đây đã chứng kiến nhiều vị khách không mời cố gắng tiếp cận đội ngũ đứng sau những đột phá trong mô hình AI gây sốt toàn cầu.

 Toàn bộ nhân viên DeepSeek ‘trốn Tết’ sau khi nổi tiếng. Ảnh: Bloomberg.

Toàn bộ nhân viên DeepSeek ‘trốn Tết’ sau khi nổi tiếng. Ảnh: Bloomberg.

DeepSeek bắt đầu gây chú ý khi ra mắt mã nguồn mở mô hình ngôn ngữ lớn có khả năng suy luận với chi phí rẻ hơn mức chung của nghành hồi giữa năm 2024. Hôm 20/1, DeepSeek R1 được giới thiệu, với điểm chuẩn vượt qua bản o1 trả phí từ OpenAI.

Tuy nhiên, startup có trụ sở tại Hàng Châu này, bao gồm nhà sáng lập Liang Wenfeng cùng đội ngũ nhà khoa học trẻ của công ty, đã tránh xa sự chú ý của công chúng khi Trung Quốc bước vào kỳ nghỉ Tết kéo dài một tuần.

Theo SCMP, khi phóng viên đến trụ sở của DeepSeek tại Hàng Châu, tòa nhà nơi công ty này thuê đã hoàn toàn vắng bóng người.

Một nhân viên bảo vệ tại đây cũng xác nhận rằng không ai có mặt tại văn phòng trong ngày 28/1 và cho biết thêm đã có nhiều vị khách không mời đã tìm đến đây trong hai ngày qua.

Tất cả đều bị từ chối, mặc dù một số người đã cố gắng gõ cửa văn phòng của công ty công nghệ đang gây bão tại Trung Quốc.

Lần cập nhật cuối cùng của công ty diễn ra vào lúc nửa đêm ngày 20/1 khi ra mắt mô hình đa phươngng thức đầu tiên của mình mang tên Janus-Pro.

Phiên bản 7 tỷ tham số của mô hình này được đánh giá vượt trội DALL-E 3 của OpenAI và Stable Diffusion của Stability AI trong các bài kiểm tra tiêu chuẩn, theo báo cáo kỹ thuật của công ty.

Không giống như nhiều startup công nghệ khác thường đặt trụ sở tại các khu công viên công nghệ, DeepSeek hoạt động trong một tòa cao ốc chủ yếu dành cho các doanh nghiệp trong ngành tài chính.

Quỹ đầu cơ High-Flyer Quant của Liang Wenfeng cũng có địa chỉ đăng ký tại cùng tòa nhà này. SCMP dẫn một nguồn tin nội bộ cho biết DeepSeek có mức độ kín tiếng đến mức không có bất kỳ ai phụ trách mảng quan hệ công chúng.

Trong khi đó, một người khác thân cận với công ty tiết lộ rằng nhiều nhân viên trẻ của DeepSeek cảm thấy kinh ngạc khi chứng kiến phản ứng mạnh mẽ của thế giới đối với các mô hình AI hiệu suất cao nhưng chi phí thấp của họ.

Theo TechCrunch, R1 vượt trội o1 của OpenAI trên các tiêu chuẩn đánh giá như AIME, MATH-500 và SWE-bench Verified. Đồng thời, một trong những mô hình của họ chỉ tốn 5,6 triệu USD, so với hàng trăm triệu USD mà các công ty hàng đầu của Mỹ phải chi để huấn luyện các mô hình của mình.

Anh Tuấn

Nguồn Znews: https://znews.vn/nhieu-nguoi-la-tim-den-van-phong-deepseek-post1528124.html