Bước đi tiếp theo của DeepSeek là gì?

3 giờ trước Gốc

Một bài đăng của nhà nghiên cứu thuộc DeepSeek, hiện đã bị xóa trên mạng xã hội, gợi ý việc sử dụng kỹ thuật học tăng cường nhằm phát triển thêm mô hình AI.

Cải tiến các hệ thống AI thông qua các thuật toán học tăng cường sẽ là bước đi tiếp theo của DeepSeek. Ảnh: SCMP.

Đầu năm 2025, startup AI Trung Quốc DeepSeek đã gây chấn động thế giới AI bằng cách ra mắt mô hình R1 siêu rẻ, có thể cạnh tranh trực tiếp với o1 của OpenAI. Sự kiện này đã đẩy giá trị vốn hóa của Nvidia sụt giảm gần 600 tỷ USD.

Mặc dù vậy, tại trụ sở chính của DeepSeek tại Hàng Châu cho đến nay vẫn giữ im lặng về các bước đi tiềm nặng tiếp theo của công ty.

Tuy nhiên, một nhà nghiên cứu AI tại DeepSeek có thể đã hé lộ một vài manh mối về các bước đi tiếp theo của startup đang được chú ý nhất toàn cầu này.

Cụ thể, trong một chuỗi bài đăng trên X vào ngày 1/2, nhà nghiên cứu của DeepSeek - Daya Guo cho biết công ty đang trên đà “đạt được tiến bộ đáng kể” trong việc cải tiến các hệ thống AI của mình thông qua các thuật toán học tăng cường (Reinforcement learning).

Học tăng cường là một loại quy trình học máy, tập trung vào việc ra quyết định bởi các tác nhân tự động, bao gồm phần mềm AI tiên tiến, robot và xe tự hành.

Những tác nhân tự động này học cách thực hiện một nhiệm vụ thông qua phép thử và sai trong điều kiện thiếu sự hướng dẫn từ người dùng. Kỹ thuật này là một yếu tố quan trọng trong phát triển mô hình AI do nó giải quyết các vấn đề ra quyết định tuần tự trong một môi trường không chắc chắn.

Guo, một trong những “những người đóng góp cốt lõi” cho mô hình lý luận R1 của DeepSeek, cũng viết thêm rằng “khoảnh khắc hạnh phúc nhất trong dịp Tết Nguyên Đán là được chứng kiến hiệu suất của R1 liên tục tăng lên và thực sự cảm nhận được sức mạnh của kỹ thuật học tăng cường”.

Sau khi DeepSeek gây tiếng vang, chuỗi bài đăng trên X của Guo sau đó đã bị xóa. Hiện nhà khoa học này vẫn chưa đưa ra bất kỳ phản hồi nào.

Anh Tuấn

OpenAI

Nguồn Znews: https://znews.vn/buoc-di-tiep-theo-cua-deepseek-la-gi-post1529677.html