Trí tuệ nhân tạo: DeepSeek mất chưa đến 300.000 USD để đào tạo mô hình R1
Nhà phát triển AI Trung Quốc DeepSeek cho biết họ chỉ cần 294.000 USD để đào tạo mô hình R1, thấp hơn nhiều so với chi phí của các đối thủ.

Biểu tượng của Deepseek. Ảnh: REUTERS/TTXVN
Ngày 18/9, trong một bài viết đăng trên tạp chí Nature, nhà phát triển AI Trung Quốc DeepSeek cho biết họ chỉ cần 294.000 USD để đào tạo mô hình R1, thấp hơn nhiều so với chi phí của các đối thủ cạnh tranh từ Mỹ.
Bài viết do Lương Văn Phong, nhà sáng lập DeepSeek, là đồng tác giả bài viết trên cũng cho biết mô hình AI tập trung vào khả năng lý luận của R1 mà DeepSeek phát triển sử dụng 512 chip H800 của Nvidia.
Chi phí đào tạo cho các mô hình ngôn ngữ lớn dùng cho chatbot AI là chi phí phát sinh từ việc vận hành một cụm chip có hiệu suất mạnh trong nhiều tuần hoặc nhiều tháng để xử lý lượng lớn văn bản và mã nguồn.
Vào năm 2023, Giám đốc điều hành (CEO) của OpenAI Sam Altman cho biết chỉ riêng việc đào tạo các mô hình nền tảng AI đã tiêu tốn hơn nhiều so với mức100 triệu USD, nhưng không công bố chi tiết trong các lần ra mắt sản phẩm.
Vì vậy, việc DeepSeek hồi tháng 1 năm nay công bố mô hình AI mới có chi phí thấp không chỉ gây sốc cho giới công nghệ toàn cầu, mà còn khiến các nhà đầu tư bán tháo cổ phiếu công nghệ vì lo ngại các mô hình mới có thể đe dọa sự thống trị của các công ty AI hàng đầu thế giới, bao gồm cả Nvidia.