Lý do thực sự đằng sau cơn sốt DeepSeek

Chuyên trang Đầu Tư Chứng Khoán - Báo Đầu Tư

18/2/2025 Gốc

DeepSeek đã làm đảo lộn thế giới công nghệ và theo các chuyên gia về trí tuệ nhân tạo (AI), có lý do chính đáng khi cho rằng chúng ta có thể chỉ mới thấy sự khởi đầu mức độ ảnh hưởng của DeepSeek lên lĩnh vực AI.

DeepSeek đã gây sốt vào cuối tháng 1 với mô hình AI R1 mà công ty cho biết có thể sánh ngang với hiệu suất của mô hình o1 của Open AI với chi phí chỉ bằng một phần nhỏ. Cổ phiếu công nghệ lao dốc khi DeepSeek tạm thời đánh bại ChatGPT để trở thành ứng dụng hàng đầu trên App Store của Apple.

Thành tích này đã thúc đẩy các tập đoàn công nghệ lớn của Mỹ đặt câu hỏi về vị thế của Mỹ trong cuộc đua AI với Trung Quốc và bên cạnh đó là hàng tỷ đô la đằng sau những nỗ lực này.

Nhưng không chỉ có hiệu quả và sức mạnh của DeepSeek, các chuyên gia cho biết, các mô hình R1 có thể lý luận và suy nghĩ thông qua các câu trả lời để cung cấp kết quả chất lượng, cùng với quyết định công khai các bộ phận chính của công nghệ, cũng sẽ thúc đẩy lĩnh vực này phát triển.

Mặc dù AI đã được sử dụng từ lâu trong các sản phẩm công nghệ, nhưng nó đã đạt đến đỉnh điểm trong hai năm qua nhờ sự phát triển của ChatGPT và các dịch vụ AI tạo sinh khác đã định hình lại cách mọi người làm việc, giao tiếp và tìm kiếm thông tin. Nó đã biến các công ty như nhà sản xuất chip Nvidia trở thành những công ty được Phố Wall yêu thích và làm đảo lộn quỹ đạo của những tập đoàn khổng lồ ở Thung lũng Silicon. Vì vậy, bất kỳ sự phát triển nào có thể giúp xây dựng các mô hình có năng lực và hiệu quả hơn chắc chắn sẽ được theo dõi sát sao.

“Đây chắc chắn không phải là sự cường điệu…Nhưng đây cũng là một thế giới chuyển động rất nhanh”, Oren Etzioni, cựu CEO của Viện Trí tuệ nhân tạo Allen cho biết.

“Khoảnh khắc TikTok” của AI

Các nhà lãnh đạo trong lĩnh vực công nghệ đã nhanh chóng phản ứng với sự trỗi dậy của DeepSeek. Theo CNBC, Demis Hassabis, CEO của Google DeepMind đã gọi sự cường điệu xung quanh DeepSeek là "phóng đại", nhưng ông cũng nói rằng mô hình của công ty này "có lẽ là công trình tốt nhất mà tôi từng thấy ở Trung Quốc".

Satya Nadella, CEO của Microsoft cho biết, DeepSeek có một số "sáng kiến thực sự", trong khi Tim Cook, CEO của Apple cho biết rằng "sáng kiến thúc đẩy hiệu quả là một điều tốt".

Nhưng không phải tất cả sự chú ý đều là tích cực. Nhà nghiên cứu chất bán dẫn SemiAnalysis đã nghi ngờ tuyên bố của DeepSeek rằng công ty chỉ mất 5,6 triệu USD để đào tạo mô hình AI. Trong khi OpenAI cho biết họ đã tìm thấy bằng chứng cho thấy DeepSeek đã sử dụng các mô hình của công ty Mỹ để đào tạo mô hình AI.

"Chúng tôi nhận thức được và đang xem xét các dấu hiệu cho thấy DeepSeek có thể đã chắt lọc không đúng cách các mô hình của chúng tôi và chúng tôi sẽ chia sẻ thông tin khi chúng tôi có thêm chi tiết", một phát ngôn viên của OpenAI cho biết.

Trong khi đó, các nhà lập pháp Mỹ đã kêu gọi cấm ứng dụng này khỏi các thiết bị của chính phủ sau khi các nhà nghiên cứu bảo mật nêu bật mối liên hệ tiềm ẩn của ứng dụng với Chính phủ Trung Quốc. Những lo ngại tương tự đã được nêu ra về ứng dụng truyền thông xã hội phổ biến TikTok, ứng dụng này phải được bán cho một chủ sở hữu người Mỹ hoặc có nguy cơ bị cấm ở Mỹ.

"DeepSeek là TikTok của các mô hình ngôn ngữ lớn", ông Oren Etzioni cho biết.

Ấn tượng sâu sắc của DeepSeek đối với thế giới công nghệ

Các tập đoàn công nghệ lớn đã nghĩ về cách công nghệ của DeepSeek có thể ảnh hưởng đến các sản phẩm và dịch vụ của họ.

"Những gì DeepSeek cung cấp cho chúng tôi về cơ bản là công thức dưới dạng báo cáo công nghệ, nhưng họ không cung cấp cho chúng tôi các phần còn thiếu", Lewis Tunstall, nhà khoa học nghiên cứu cấp cao tại Hugging Face cho biết.

Satya Nadella, CEO của Microsoft cho biết, PC Windows Copilot+ hoặc PC được xây dựng theo thông số kỹ thuật nhất định để hỗ trợ các mô hình AI sẽ có thể chạy các mô hình AI được chắt lọc từ DeepSeek R1 cục bộ. Nhà sản xuất chip di động Qualcomm cho biết các mô hình được chắt lọc từ DeepSeek R1 đã chạy trên điện thoại thông minh và PC được cung cấp năng lượng bởi chip của hãng trong vòng một tuần.

Các nhà nghiên cứu, học giả và nhà phát triển AI vẫn đang khám phá ý nghĩa của DeepSeek đối với sự phát triển của AI.

Mô hình của DeepSeek không phải là mô hình nguồn mở duy nhất, cũng không phải là mô hình đầu tiên có thể suy luận về các câu trả lời trước khi phản hồi, và mô hình o1 của OpenAI từ năm ngoái cũng có thể làm được điều đó.

Điều làm cho DeepSeek trở nên quan trọng là cách nó có thể suy luận và học hỏi từ các mô hình khác, cùng với thực tế là cộng đồng AI có thể thấy những gì đang diễn ra đằng sau hậu trường. Những người sử dụng mô hình R1 trong ứng dụng DeepSeek cũng có thể thấy quá trình "suy nghĩ" của nó khi nó trả lời các câu hỏi.

Nhà khoa học Lewis Tunstall cho rằng chúng ta có thể thấy một làn sóng các mô hình mới có thể lý luận như DeepSeek trong tương lai không xa. Điều đó có thể rất quan trọng khi các tập đoàn công nghệ chạy đua để xây dựng các tác nhân AI, mà Thung lũng Silicon thường tin là sự phát triển tiếp theo của chatbot và cách người tiêu dùng sẽ tương tác với các thiết bị, mặc dù sự thay đổi đó vẫn chưa diễn ra.

Hiện tại, cộng đồng AI sẽ tiếp tục mày mò những gì DeepSeek cung cấp, cho đến khi có bước đột phá tiếp theo.

"Tôi chắc chắn dự đoán rằng trong 12 tháng tới, nó sẽ bị thay thế bởi thứ gì đó khác…Nhưng đó là một bước tiến rất thực tế", ông Oren Etzioni cho biết.

Hạc Hiên / Theo báo chí nước ngoài

Nguồn ĐTCK: https://tinnhanhchungkhoan.vn/ly-do-thuc-su-dang-sau-con-sot-deepseek-post363566.html