DeepSeek tiết lộ phương pháp lý luận AI mới

Các nhà nghiên cứu của DeepSeek cho biết mô hình phần thưởng tạo ra (GRM) này vượt trội hơn so với các phương pháp hiện có và có thể đạt hiệu suất cạnh tranh với những mô hình phần thưởng mạnh mẽ khác.

DeepSeek công bố phương pháp lý luận AI mới. Ảnh: SCMP.

DeepSeek công bố phương pháp lý luận AI mới. Ảnh: SCMP.

Công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek, có trụ sở tại Hàng Châu, Trung Quốc, đã giới thiệu một phương pháp mới nhằm cải thiện khả năng suy luận của các mô hình ngôn ngữ lớn (LLM).

Theo một bài báo được công bố vào thứ sáu, DeepSeek đã hợp tác với các nhà nghiên cứu từ Đại học Thanh Hoa để phát triển một kỹ thuật kết hợp các phương pháp được gọi là mô hình phần thưởng tạo ra (Generative Reward Modelling - GRM) và điều chỉnh phê bình tự nguyên tắc. Phương pháp tiếp cận kép này nhằm mục đích cho phép LLM cung cấp kết quả tốt hơn và nhanh hơn cho các truy vấn chung.

Mô hình GRM là một quá trình giúp hướng dẫn LLM theo sở thích của con người, giúp tối ưu hóa khả năng trả lời các câu hỏi và xử lý thông tin.

Các nhà nghiên cứu của DeepSeek cho biết mô hình GRM mới này vượt trội hơn so với các phương pháp hiện có và có thể đạt hiệu suất cạnh tranh với những mô hình phần thưởng mạnh mẽ khác. Dự kiến, công ty sẽ phát hành mã nguồn mở cho mô hình GRM trong tương lai, mặc dù chưa đưa ra mốc thời gian cụ thể.

Bài báo này được công bố trong bối cảnh sự chú ý ngày càng tăng đối với DeepSeek, đặc biệt là sau khi công ty phát hành mô hình DeepSeek-V3 vào tháng trước. Mẫu V3 đã được nâng cấp để “nâng cao khả năng suy luận, tối ưu hóa phát triển web front-end và cải thiện trình độ viết tiếng Trung”.

Công ty cũng đã mở mã nguồn cho năm kho lưu trữ mã của mình, cho phép các nhà phát triển xem xét và đóng góp vào quá trình phát triển phần mềm.

DeepSeek, được thành lập vào năm 2023 bởi doanh nhân Lương Văn Phong, đã nhanh chóng thu hút sự chú ý toàn cầu nhờ vào những tiến bộ đáng kể trong công nghệ AI.

Lương Văn Phong, người sáng lập DeepSeek, cũng là giám đốc điều hành của High-Flyer Quant, một quỹ tài trợ cho các nghiên cứu và phát triển công nghệ. Với sự hỗ trợ tài chính mạnh mẽ, DeepSeek đang đặt mục tiêu trở thành một trong những công ty dẫn đầu trong ngành công nghệ AI toàn cầu, với cam kết không ngừng cải tiến và phát triển các mô hình AI mạnh mẽ hơn.

Các mô hình ngôn ngữ lớn (LLM) ngày càng trở nên quan trọng trong việc xử lý dữ liệu, dự đoán và cung cấp các câu trả lời chính xác trong nhiều lĩnh vực khác nhau. Những tiến bộ như DeepSeek-GRM đang dần định hình lại cách mà AI có thể được sử dụng để cải thiện hiệu suất và khả năng của các mô hình này.

Trong khi DeepSeek vẫn giữ im lặng về các tin đồn phát hành mô hình mới DeepSeek-R2, công ty được cho là đang gấp rút tận dụng cơ hội để phát hành phiên bản tiếp theo trong thời gian sắp tới. Dù công ty không đưa ra bình luận chính thức, thông tin về mô hình mới này đã gây xôn xao trong cộng đồng công nghệ, khi các chuyên gia tin rằng DeepSeek có thể là đối thủ của các công ty AI lớn như OpenAI và Google.

Với sự phát triển nhanh chóng của DeepSeek và những tiến bộ mà công ty này đang đạt được, ngành công nghiệp trí tuệ nhân tạo đang chứng kiến một sự thay đổi lớn, khi các công ty khởi nghiệp như DeepSeek đang dần trở thành những người dẫn đầu trong cuộc đua phát triển công nghệ AI.

Theo SCMP

Tiến Dũng

Nguồn VietTimes: https://viettimes.vn/deepseek-tiet-lo-phuong-phap-ly-luan-ai-moi-post184337.html?utm_source=web_vt&utm_medium=home_noibat_vt&utm_campaign=noibat