DeepSeek cạnh tranh với ChatGPT: Cách dùng đơn giản, độ chính xác gây bất ngờ
Được phát triển bởi một công ty start-up non trẻ và đội ngũ chỉ với 200 người, DeepSeek - chatbot mới của Trung Quốc đang tạo nên nhiều biến động trong thị trường công nghệ thế giới.
Nền tảng chatbot mới này được đặt tên là DeepSeek, cùng tên gọi với công ty sở hữu và được xem là "tay mới" trong cuộc đua trí tuệ nhân tạo khi chỉ mới bắt đầu hoạt động từ tháng 5/2023. Đáng chú ý, toàn bộ nhân sự của công ty, bao gồm cả đội ngũ nghiên cứu tham gia phát triển DeepSeek đều là người Trung Quốc.
DeepSeek đã thu hút sự quan tâm từ khi ra mắt mô hình đầu tiên vào năm 2023. Đến tháng 11, công ty giới thiệu DeepSeek R1, một mô hình lý luận AI mô phỏng tư duy con người. Mô hình này làm nền tảng cho ứng dụng chatbot di động của họ, và khi ra mắt giao diện web vào tháng 1, nó nhanh chóng trở nên nổi tiếng toàn cầu như một lựa chọn thay thế cho ChatGPT của OpenAI với chi phí thấp hơn nhiều.
Theo dữ liệu từ App Figures, tính đến ngày 25/1, ứng dụng DeepSeek đã được tải xuống 1,6 triệu lần và đứng đầu bảng xếp hạng App Store của iPhone tại Úc, Canada, Trung Quốc, Singapore, Mỹ và Anh.
Việc DeepSeek "gây sốt" phần lớn đến từ mô hình hoạt động và cách thức đưa ra câu trả lời của nền tảng này. Khác với các chatbot như ChatGPT hay Copilot, DeepSeek cung cấp câu trả lời bằng cách giải thích lập luận trước khi đưa ra phản hồi cuối cùng.
Thậm chí, so với những ứng dụng khác đến từ Trung Quốc, việc đăng ký, đăng nhập vào website của chatbot này cũng đơn giản hơn, khi người dùng có thể chọn sử dụng bằng việc mở mới tài khoản hay sử dụng thông qua tài khoản Gmail. Việc sử dụng tiếng Việt trên nền tảng này cũng hoàn toàn khả dụng.
Trong một loạt bài kiểm tra tiêu chuẩn của bên thứ ba, mô hình của DeepSeek đã vượt Llama 3.1 của Meta, GPT-4o của OpenAI và Claude Sonnet 3.5 của Anthropic với độ chính xác từ giải quyết vấn đề phức tạp đến toán học và mã hóa.
Không chỉ gây ấn tượng về mô hình hoạt động hiệu quả, chi phí phát triển chatbot này cũng khá "phải chăng". DeepSeek tiết lộ, họ mất 5,6 triệu USD (khoảng 140 tỷ đồng) để đào tạo một trong những mô hình mới nhất của mình, thấp hơn nhiều so với mức 100 triệu USD (khoảng 2,5 nghìn tỷ đồng) đến 1 tỷ USD (khoảng 25 nghìn tỷ đồng) mà các chuyên gia về công nghệ dự đoán để xây dựng 1 mô hình AI.
Nhờ chi phí thấp hơn, DeepSeek đã thúc đẩy giá thành phát triển AI giảm mạnh tại Trung Quốc và buộc OpenAI và các công ty AI Mỹ phải giảm giá để duy trì vị thế.
Đồng thời, mô hình này cũng khơi lên nhiều cuộc tranh luận về khoản đầu tư khổng lồ của các tập đoàn như Meta và Microsoft, khi chỉ mới vài ngày trước, cả 2 "ông lớn" này đều cam kết chi 65 tỷ USD trở lên trong năm 2025 vào hạ tầng AI; hay dự án AI Stargate trị giá 500 tỷ USD có sự tham gia của đầy đủ của các công ty công nghệ lớn như OpenAI, Oracle, NVIDIA, Microsoft và được Soft Bank hậu thuẫn tài chính vừa được Tổng thống Mỹ Donald Trump công bố.
Dù được nhiều dân chuyên môn đánh giá cao, DeepSeek, tương tự như nhiều ứng dụng khác của Trung Quốc, vẫn phải chịu nhiều ràng buộc của luật pháp nội địa hay tự động kiểm duyệt đối với các chủ đề nhạy cảm về chính trị, quốc phòng. Ngoài ra, hạ tầng đám mây của DeepSeek đang bị thử thách bởi sự bùng nổ người dùng. Công ty đã gặp sự cố gián đoạn lớn vào ngày 27/1 và sẽ cần quản lý tốt hơn để duy trì hiệu suất khi lưu lượng truy cập tiếp tục tăng cao.
Nhìn chung, khá khó dự đoán rằng trong thời gian tới, DeepSeek sẽ tiếp tục có những hướng đi gì. Thế nhưng, nhìn vào sức ảnh hưởng của startup công nghệ này đến thị trường công nghệ thế giới trong thời gian vừa qua, không khó để thấy rằng DeepSeek có thể gây ảnh hưởng lớn đến ngành công nghệ và chuỗi cung ứng toàn cầu cũng như thách thức quan điểm phổ biến rằng AI trong tương lai sẽ đòi hỏi ngày càng nhiều năng lượng và tài nguyên để phát triển.