Siêu AI của Trung Quốc gián tiếp khiến Nvidia mất 589 tỷ USD vốn hóa
DeepSeek hiện được đánh giá có thể là 'mối đe dọa lớn nhất' đối với thị trường Mỹ khi một công ty Trung Quốc có thể xây dựng mô hình vượt trội với chi phí thấp.
LLM (Mô hình Ngôn ngữ lớn) là nền tảng của chatbot trí tuệ tạo sinh như ChatGPT. Trong ngành, lượng tham số đóng vai trò then chốt trong việc cho phép LLM thích ứng với các mẫu dữ liệu phức tạp hơn và đưa ra các dự đoán ngôn ngữ chính xác.
Tuy nhiên, DeepSeek V3 - mô hình của startup có trụ sở tại Hàng Châu, Trung Quốc khiến cả giới công nghệ bất ngờ khi đạt 671 tỷ tham số. Trong khi đó, start-up này chỉ mất 2 tháng huấn luyện với chi phí 5,58 triệu USD.
Để so sánh, DeepSeek sử dụng ít tài nguyên tính toán hơn đáng kể so với các mô hình được phát triển bởi các công ty công nghệ lớn như Meta (công ty mẹ của Facebook) và OpenAI (nhà phát triển ChatGPT).
Điều này gián tiếp khiến giá cổ phiếu doanh nghiệp AI Mỹ giảm "sập sàn". Kết phiên giao dịch ngày 27/1, giá cổ phiếu của Nvidia đã giảm 24%, 589 tỷ USD vốn hóa bị bốc hơi, kỷ lục toàn ngành, theo Bloomberg.
Rung chuyển Thung lũng Silicon
Ngay từ khi DeepSeek, công ty khởi nghiệp trí tuệ nhân tạo (AI) Trung Quốc thông báo ra mắt mô hình R1 vào ngày 20/1 vừa qua, nhiều cái tên uy tín trong lĩnh vực này đã có bình luận về dòng mô hình mạnh mẽ được xây dựng với chi phí thấp.
Các bình luận xoay quanh thành tựu của DeepSeek và sự ra đời của R1 có ý nghĩa gì với thị trường trí tuệ nhân tạo. Nhà đầu tư mạo hiểm Marc Andreessen là một ví dụ, khi ông cho rằng DeepSeek là “một trong những đột phá tuyệt vời và ấn tượng nhất” mà mình từng thấy.
Theo TechCrunch, R1 vượt trội o1 của OpenAI trên các tiêu chuẩn đánh giá như AIME, MATH-500 và SWE-bench Verified. Đồng thời, một trong những mô hình của họ chỉ tốn 5,6 triệu USD, so với hàng trăm triệu USD mà các công ty hàng đầu của Mỹ phải chi để huấn luyện các mô hình của mình.
Điều này đặt ra nghi vấn về giá trị thật sự của các công ty chuyên bán GPU như Nvidia, cái tên dẫn đầu đợt bùng nổ cổ phiếu AI toàn cầu. Mức giảm 24% trong phiên giao dịch vừa qua đánh dấu ngày tồi tệ nhất của hãng bán dẫn, từ tháng 3/2020. Đồng thời, hiệu suất cổ phiếu công ty cũng ở mức đáng báo động, yếu hơn hẳn mức trung bình 200 ngày qua.
Ở châu Âu, cổ phiếu công nghệ dẫn đầu mức giảm của thị trường, với cổ phiếu của nhà sản xuất thiết bị chip ASML Holding giảm 11%.
Chỉ số biến động Cboe (VIX) cũng tăng vọt. Nếu mức giảm được giữ vững, Nasdaq 100 và chỉ số phụ công nghệ Stoxx 600 của châu Âu sẽ mất khoảng 1 nghìn tỷ USD vốn hóa thị trường.
"DeepSeek cho thấy hoàn toàn có thể phát triển các mô hình AI mạnh mẽ với chi phí thấp hơn. Điều này có thể phá vỡ cơ sở đầu tư cho toàn bộ chuỗi cung ứng AI, vốn được thúc đẩy bởi chi tiêu lớn từ một số ít công ty công nghệ hàng đầu", Vey-Sern Ling, Giám đốc điều hành tại Union Bancaire Priveé cho biết.
Kẻ thay đổi cuộc chơi
Sự xuất hiện của DeepSeek đặt ra nhiều câu hỏi về hiệu quả đầu tư khổng lồ vào cơ sở hạ tầng AI của các công ty Mỹ. Nvidia đã chứng kiến mức giảm giá trị thị trường gần 400 tỷ USD, mức giảm lớn nhất từng được ghi nhận cho một công ty.
Financial Times ví DeepSeek với "khoảnh khắc Sputnik" của AI, ám chỉ sự kiện Liên Xô phóng vệ tinh đầu tiên vào quỹ đạo, gây chấn động nước Mỹ.
Mặc dù CEO Liang Wenfeng đã nói với Thủ tướng Trung Quốc rằng các hạn chế xuất khẩu của Mỹ vẫn gây ra nhiều khó khăn cho việc nghiên cứu, DeepSeek vẫn đạt được thành công với R1 giữa bối cảnh các lệnh trừng phạt,
MIT Technology Review cho rằng thành công của DeepSeek cho thấy những lệnh trừng phạt đang "thúc đẩy các startup đổi mới theo hướng ưu tiên hiệu quả, chia sẻ nguồn lực và hợp tác”.
Năm 2023, DeepSeek được tách ra từ quỹ đầu cơ High Flyer-Quant. Nhà sáng lập High-Flyer Quant, Liang Wenfeng, cũng chính là người đứng sau DeepSeek, từng được đào tạo về AI tại Đại học Chiết Giang.
Sau khi Washington cấm Nvidia xuất khẩu các chip mạnh nhất sang Trung Quốc, các công ty AI trong nước buộc phải tìm cách sáng tạo để tối đa hóa sức mạnh tính toán của số chip giới hạn tại nội địa.
Đây là một vấn đề mà đội ngũ của Wenfeng đã sớm biết cách giải quyết khi đã rất thành thạo trong việc sử dụng chip Nvidia để kiếm tiền từ giao dịch cổ phiếu.
“Kỹ sư của DeepSeek biết cách khai thác tiềm năng của các GPU này, ngay cả khi chúng không phải là mẫu hiện đại nhất”, Financial Times trích lời một nhà nghiên cứu AI quen thuộc với DeepSeek cho biết.
Những người trong ngành cho rằng sự tập trung duy nhất vào nghiên cứu đã khiến DeepSeek trở thành một đối thủ nguy hiểm vì họ sẵn sàng chia sẻ các đột phá thay vì bảo vệ chúng để kiếm lợi nhuận thương mại.
Liang Wenfeng, người cũng tham gia trực tiếp vào các nghiên cứu của DeepSeek, sử dụng lợi nhuận từ quỹ đầu cơ High Flyer-Quant để trả mức lương cao nhất cho các nhân tài AI hàng đầu.
Cùng với ByteDance - công ty sở hữu TikTok, DeepSeek được biết đến với việc trả thù lao cao nhất cho các kỹ sư AI tại Trung Quốc, với văn phòng đặt tại Hàng Châu và Bắc Kinh.
Theo tiết lộ của ông Liang trong cuộc phỏng vấn với trang tin trực tuyến 36Kr hồi tháng 5/2023, DeepSeek ưu tiên tuyển dụng những nhân sự trẻ trong lĩnh vực AI, từ sinh viên mới ra trường đến những người mới bắt đầu sự nghiệp.
Chính sách này thể hiện rõ quan điểm trọng dụng năng lực hơn kinh nghiệm của công ty. "Các vị trí kỹ thuật cốt lõi của chúng tôi chủ yếu được đảm nhiệm bởi sinh viên mới tốt nghiệp hoặc những người chỉ có một hoặc hai năm kinh nghiệm làm việc", ông Liang cho biết.
Thành công của DeepSeek là minh chứng cho thấy không có rào cản thực sự nào khi nói đến khả năng phát triển AI.
“Người đầu tiên huấn luyện các mô hình phải chi rất nhiều tài nguyên để đạt được điều đó. Nhưng người đi sau có thể đạt được điều đó rẻ hơn và nhanh hơn", Ritwik Gupta, nhà nghiên cứu chính sách AI tại Đại học California nhận định.