Chưa hết 'nóng', DeepSeek phá vỡ ảo tưởng về sự thống trị công nghệ của Hoa Kỳ

DeepSeek đang gây chú ý trong thế giới AI, chiếm lĩnh tiêu đề báo chí và cửa hàng ứng dụng, thậm chí vượt qua ChatGPT của OpenAI. Tuy nhiên, nhiều chuyên gia hoài nghi và cho rằng đây chỉ là sự cường điệu. Vậy sự thật là gì?

DeepSeek. Hình ảnh: Getty

DeepSeek. Hình ảnh: Getty

DeepSeek: Tương lai của AI nằm ở việc tập trung hơn vào nguồn mở, chi phí thấp?

DeepSeek được xem là một đột phá công nghệ khi ra mắt vào ngày 20/1 vừa qua, khiến các phòng họp công nghệ toàn cầu phải đặt câu hỏi: Nên đầu tư vào mô hình LLM của Mỹ, Trung Quốc hay cả hai? Đột phá này đã làm thay đổi tư duy và cách thức hoạt động của ngành công nghiệp AI và giới chính sách toàn cầu trong tương lai.

Việc áp dụng mã nguồn mở cũng là yếu tố then chốt trong phát triển LLM của công ty công nghệ Trung Quốc. DeepSeek-V3 và DeepSeek-R1 được phát hành dưới giấy phép MIT, cho phép người dùng tự do sử dụng, sửa đổi và phân phối phần mềm với hạn chế tối thiểu.

Ưu điểm về chi phí đào tạo của kiến trúc hiệu quả này nổi bật: DeepSeek chỉ tốn 5,6 triệu đô la cho V3 trong khi các công ty AI Mỹ như OpenAI và Alphabet tiêu tốn từ 40-200 triệu đô la cho LLM của họ. Như vậy, chi phí DeepSeek rẻ hơn 7-35 lần các mô hình LLM đã từng có trước đó. Điều này gây sốc đối với giới đầu tư, tại sao họ không thể "bỏ tiền" vào đầu tư vào các LLM rẻ hơn nhưng "đủ tốt" như DeepSeek của Trung Quốc?

Hơn nữa, trong khi các mô hình Mỹ tập trung vào truy vấn chung từ tập dữ liệu lớn toàn cầu, mô hình LLM của Trung Quốc lại được phát triển với độ chính xác trong từng lĩnh vực. Các ông lớn công nghệ Trung Quốc như Alibaba, Tencent, Baidu, ByteDance và các startup như DeepSeek cung cấp ứng dụng chuyên ngành hỗ trợ bởi LLM, tích hợp sâu vào hệ sinh thái kỹ thuật số của Trung Quốc.

Thành công của công ty Trung Quốc có thể được lý giải bởi sự đổi mới tập trung vào các giải pháp chi phí thấp, không hẳn tiên tiến nhưng vẫn hoạt động hiệu quả cho nhiều người dùng. DeepSeek đã làm dấy lên một làn sóng trong ngành AI, thách thức các giả định của Mỹ và khiến cổ phiếu công nghệ, năng lượng giảm giá.

Đi xa hơn, một mô hình LLM với mã nguồn mở, chi phí thấp và yêu cầu dữ liệu đào tạo nhỏ, dù kém hơn mô hình mã nguồn đóng, vẫn sẽ hỗ trợ các công ty phát triển mô hình riêng phù hợp với bối cảnh cụ thể. Dần dần, những mô hình này có thể chiếm ưu thế so với các mô hình cao cấp, giống như các nhà máy nhỏ đã làm với các nhà máy thép tích hợp trên mọi phân khúc thị trường.

Đối với các công ty toàn cầu sử dụng LLM, sự gián đoạn trong lĩnh vực này mở ra cơ hội đầu tư vào phát triển kỹ năng nội bộ và xây dựng các mô hình chuyên biệt, dẫn đến các trường hợp sử dụng mục tiêu hơn, chi phí thấp hơn và ROI cao hơn.

DeepSeek: Sự khác biệt chính so với Tiktok

Việc máy chủ của DeepSeek đặt tại Trung Quốc đang tạo ra sự khác biệt rõ rệt so với TikTok, nền tảng mạng xã hội nổi tiếng cũng thuộc sở hữu của Trung Quốc. Vào năm 2022, để giảm bớt lo lắng từ phía Mỹ, ByteDance (công ty mẹ của TikTok) đã chuyển toàn bộ dữ liệu tại Mỹ sang cơ sở hạ tầng do Oracle, một công ty phần mềm của Mỹ sở hữu.

Chuyên gia nghiên cứu về Trung Quốc tại Quỹ Carnegie vì Hòa bình Quốc tế, Matt Sheehan nhận định rằng DeepSeek có thể ít bị coi là mối đe dọa hơn so với TikTok vì đây là một mô hình ngôn ngữ lớn mã nguồn mở.

"Nhiều ứng dụng và mô hình mã nguồn mở cho phép người dùng tiếp cận trực tiếp mà không gặp vấn đề về quyền riêng tư hay bảo mật dữ liệu. Chẳng hạn, Perplexity, một công ty AI lớn của Mỹ, đang sử dụng phiên bản DeepSeek mà không cần lo ngại về những rủi ro này."

Tuy nhiên, nhiều chuyên gia bày tỏ quan ngại về việc DeepSeek thu thập dữ liệu cá nhân từ người dùng. Theo chính sách bảo mật của công ty, dữ liệu như ngày sinh, thông tin đánh máy, văn bản, âm thanh đầu vào, tệp tải lên và lịch sử trò chuyện đều được lưu trữ trên các máy chủ tại Trung Quốc. Điều này gợi nhớ đến các mối lo ngại tương tự từng được nêu ra với TikTok.

CBS News đã trích dẫn lời ca ngợi của Nvidia dành cho DeepSeek: "DeepSeek là một bước tiến lớn trong lĩnh vực AI và là ví dụ điển hình cho khả năng mở rộng thời gian thử nghiệm. Dự án này minh họa cách tạo ra các mô hình mới bằng các kỹ thuật hiện có đồng thời tuân thủ hoàn toàn các quy định về kiểm soát xuất khẩu".

Sự phụ thuộc của DeepSeek vào công nghệ Nvidia cho thấy Hoa Kỳ vẫn giữ vai trò quan trọng trong hệ sinh thái AI. Mô hình được đào tạo trên các chip Nvidia cũ nhưng mạnh mẽ, đã được tối ưu hóa và mua trước khi Hoa Kỳ siết chặt kiểm soát vào năm 2024.

Mô hình DeepSeek đánh dấu một bước tiến trong công nghệ trí tuệ nhân tạo, mang lại tín hiệu tích cực cho thị trường và nền kinh tế, dù có thể chuyển giá trị từ bán dẫn, cơ sở hạ tầng trung tâm dữ liệu và năng lượng sang các công ty siêu quy mô và những bên hưởng lợi về doanh thu trong trung hạn. Những mô hình hiệu quả hơn sẽ thúc đẩy thương mại hóa AI và giảm áp lực lên chi tiêu vốn cùng nhu cầu năng lượng.

Sự xuất hiện của DeepSeek nhắc nhở rằng cuộc đua AI vẫn đang diễn ra, đồng thời khẳng định sự nổi lên của Trung Quốc như một đối thủ mạnh và sức mạnh của hệ sinh thái AI Hoa Kỳ. Bằng cách tận dụng cơ hội này, công nghệ toàn cầu có thể tạo ra những cơ hội cho sự thịnh vượng và đổi mới chung.

Minh Phú

Nguồn Công dân & Khuyến học: https://congdankhuyenhoc.vn/chua-het-nong-deepseek-pha-vo-ao-tuong-ve-su-thong-tri-cong-nghe-cua-hoa-ky-179250202080325754.htm