Sự xuất hiện đột ngột của DeepSeek dẫn tới mối quan ngại cho Mỹ
DeepSeek - công ty khởi nghiệp trí tuệ nhân tạo (AI) của Trung Quốc có thể phải đối mặt với hạn chế từ chính phủ Mỹ khi làm đảo lộn hệ sinh thái AI của Mỹ, mặc dù việc thực thi các hạn chế đối với công nghệ nguồn mở có thể là một thách thức.
Điều này cũng gây chấn động khắp Phố Wall và Thung lũng Silicon sau khi DeepSeek cho thấy hiệu suất dường như ngang bằng hoặc thậm chí vượt trội hơn hiệu suất của các đối thủ AI của Mỹ như ChatGPT của OpenAI dù với một phần nhỏ khoản đầu tư. Và những diễn biến này cũng đưa Liang Wenfeng - người đứng đầu đội ngũ phát triển DeepSeek - trở nên nổi tiếng.
Vào tháng 12/2024, DeepSeek đã phát hành một mô hình ngôn ngữ lớn nguồn mở miễn phí, được công ty tuyên bố là được xây dựng chỉ trong hai tháng và chỉ tốn một phần nhỏ chi phí. Tuần trước, DeepSeek đã phát hành một mô hình lý luận được cho là vượt trội hơn các sản phẩm mới nhất của OpenAI trong nhiều bài kiểm định của bên thứ ba.
DeepSeek - công ty có chatbot AI đã trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của Apple tại Mỹ - cho biết họ đã tạo ra mô hình này bất chấp các biện pháp kiểm soát toàn diện được Mỹ áp dụng vào năm 2022 đối với quyền truy cập của Trung Quốc vào các chip Nvidia tiên tiến nhất.
DeepSeek cho biết, họ đã sử dụng các chip Nvidia H800 kém tiên tiến hơn để xây dựng mô hình này, với chi phí chưa đến 6 triệu USD.
"Mặc dù vẫn chưa biết liệu DeepSeek có chứng minh được là một giải pháp thay thế khả thi và rẻ hơn trong dài hạn hay không, nhưng những lo ngại ban đầu tập trung vào việc liệu sức mạnh định giá của các công ty công nghệ khổng lồ của Mỹ có bị đe dọa hay không và liệu khoản chi tiêu khổng lồ cho AI của họ có cần được đánh giá lại hay không", Jun Rong Yeap, chiến lược gia của IG Asia cho biết.
Chi phí phát triển và mức tiêu thụ năng lượng chính xác của DeepSeek không được ghi chép đầy đủ, nhưng công ty khởi nghiệp này đã đưa ra các số liệu cho thấy chi phí của họ chỉ bằng một phần nhỏ so với các mô hình mới nhất của OpenAI. Việc một mô hình AI nhỏ và hiệu quả xuất hiện từ Trung Quốc - quốc gia đang phải chịu lệnh trừng phạt thương mại ngày càng tăng của Mỹ đối với các chip Nvidia tiên tiến - cũng đang thách thức hiệu quả của các biện pháp như vậy.
"Mỹ rất giỏi về nghiên cứu và đổi mới, đặc biệt là đột phá, nhưng Trung Quốc lại giỏi hơn về kỹ thuật…Trong thời đại ngày nay, khi có năng lực tính toán và tiền bạc hạn chế, chúng ta sẽ học cách xây dựng mọi thứ rất hiệu quả”, nhà khoa học máy tính Kai-Fu Lee cho biết.
Mặt khác, Nvidia đã mô tả mô hình AI mới của DeepSeek là một "tiến bộ AI tuyệt vời" tuân thủ đầy đủ các hạn chế của chính phủ Mỹ đối với xuất khẩu công nghệ. Nvidia cho biết công trình của công ty khởi nghiệp này "minh họa cách tạo ra các mô hình mới" bằng một kỹ thuật được gọi là tăng khả năng tính toán thời gian thử nghiệm. (Test Time Scaling là kỹ thuật được áp dụng sau khi đào tạo và trong quá trình suy luận nhằm nâng cao hiệu suất và thúc đẩy hiệu quả mà không cần đào tạo lại mô hình).
Mối lo ngại của Mỹ
Trong khi đó, sự bùng nổ đột ngột của DeepSeek đã đặt ra câu hỏi về tính hiệu quả của các nỗ lực của Mỹ nhằm hạn chế quyền tiếp cận công nghệ cao cấp của Trung Quốc vì vấn đề lo ngại về an ninh quốc gia.
Lawrence Ward, đối tác tại công ty luật Dorsey & Whitney tại Mỹ chuyên về luật an ninh quốc gia cho biết, các hạn chế xuất khẩu bổ sung mà Chính phủ Mỹ có thể áp dụng là có hạn đối với DeepSeek (công ty phụ thuộc rất nhiều vào mã nguồn mở).
Hơn nữa, DeepSeek có thể phải đối mặt với các hình phạt dân sự và hình sự, nhưng việc thực thi các hình phạt đó có thể "khó khăn nếu không muốn nói là không thể", ông cho biết.
Hôm thứ Hai (27/1), các nhà lập pháp Mỹ đã kêu gọi hành động để làm hạn chế sự tiến triển của DeepSeek mà một số người cho là "mối đe dọa nghiêm trọng".
Paul Triolo, đối tác tại Albright Stone Group cho biết, không có giải pháp dễ dàng nào để hạn chế việc sử dụng mô hình nguồn mở, đặc biệt là mô hình đang được các tổ chức và cá nhân thử nghiệm và sử dụng rộng rãi.
Trong khi đó, Tổng thống Donald Trump cho biết, sự tiến bộ của ứng dụng AI DeepSeek của Trung Quốc nên là hồi chuông cảnh tỉnh đối với các công ty công nghệ của Mỹ, đồng thời ca ngợi mô hình chi phí thấp này là "một bước phát triển rất tích cực" đối với AI nói chung. "Thay vì chi hàng tỷ đô la, chúng ta sẽ chi ít hơn và hy vọng là sẽ đưa ra được giải pháp tương tự", Tổng thống Trump cho biết.
Bên cạnh đó, hiệu quả về chi phí và hiệu suất mà DeepSeek tuyên bố đã khiến cổ phiếu công nghệ Mỹ lao dốc khi các nhà đầu tư đặt nghi vấn về số tiền mà các công ty công nghệ lớn đã đầu tư vào các mô hình AI và trung tâm dữ liệu. Các công ty Mỹ hiện có thể tận dụng các mã công khai để tinh chỉnh các mô hình và có thể giảm chi phí tính toán.
Hạ nghị sĩ John Moolenaar (bang Michigan), Chủ tịch Ủy ban đặc biệt về quan hệ giữa Mỹ và Trung Quốc cho biết chính phủ Mỹ nên nỗ lực áp dụng các biện pháp kiểm soát xuất khẩu chặt chẽ hơn đối với các công nghệ quan trọng đối với cơ sở hạ tầng AI của DeepSeek.
"Tình hình này có phần chưa từng có và không có khả năng bất kỳ ai ở Mỹ có ý tưởng rõ ràng về việc phải làm gì về vấn đề này... rõ ràng là chúng ta đang ở trong vùng chưa được khám phá ở nhiều cấp độ", Paul Triolo, đối tác tại Albright Stone cho biết.