Deepseek ra mắt mô hình toán học đạt chuẩn huy chương vàng quốc tế
DeepseekMath-V2 - mô hình mới của Deepseek - ghi điểm tương đương huy chương vàng tại hàng loạt kỳ thi toán học uy tín như IMO, CMO hay Putnam, đưa công ty Trung Quốc vào nhóm đối thủ cạnh tranh trực tiếp với các phòng thí nghiệm AI hàng đầu của Mỹ.
Deepseek vừa công bố mô hình DeepseekMath-V2 với năng lực suy luận nâng cao, đạt thành tích tương đương huy chương vàng tại nhiều kỳ thi toán học danh giá. Đây được xem là bước tiến quan trọng, đưa công ty Trung Quốc tiến gần hơn tới năng lực của các phòng thí nghiệm AI hàng đầu Mỹ – những đơn vị vốn chiếm ưu thế trong khả năng lập luận của mô hình ngôn ngữ.
Theo tài liệu kỹ thuật, DeepseekMath-V2 cho ra kết quả tương đương huy chương vàng tại Olympic Toán học quốc tế (IMO) 2025 và kỳ thi CMO Trung Quốc 2024. Trong kỳ thi Putnam, mô hình ghi nhận kết quả 118/120 điểm – vượt xa điểm số 90 của thí sinh có kết quả cao nhất từng được ghi nhận. Các chỉ số này cho thấy khả năng xử lý những bài toán ở mức độ phức tạp cao.

Theo Deepseek, hạn chế lớn nhất của các mô hình AI trước đây nằm ở việc có thể đưa ra đáp án đúng nhưng không giải thích được lời giải hợp lệ. Để khắc phục, DeepseekMath-V2 được xây dựng với quy trình nhiều giai đoạn, gồm đánh giá mức độ chính xác, kiểm tra phản biện và đưa ra kết luận sau cùng. Nhờ đó, hệ thống có thể tự rà soát và điều chỉnh lập luận theo thời gian thực, tránh tình trạng kết luận đúng nhưng lập luận sai.
Đáng chú ý, trong tài liệu công bố, Deepseek không đề cập việc mô hình sử dụng công cụ bên ngoài như máy tính hay trình thông dịch mã. Các thử nghiệm cho thấy toàn bộ lời giải được tạo ra bằng ngôn ngữ tự nhiên.
Theo Deepseek, hiệu suất của mô hình được nâng cao nhờ khả năng tự phản biện và tự điều chỉnh, không dựa vào phần mềm toán học chuyên dụng. Với các bài toán khó, hệ thống mở rộng tính toán bằng cách tạo nhiều lời giải song song, từ đó tăng độ tin cậy của đáp án cuối.
DeepseekMath-V2 xuất hiện ngay sau thời điểm OpenAI và Google DeepMind cho biết các mô hình chưa công bố của họ cũng đạt mức huy chương vàng tại IMO – thành tích từng được xem là ngoài khả năng của mô hình ngôn ngữ lớn. Tuy nhiên, thông tin chi tiết về các hệ thống này vẫn rất hạn chế, ngoài chia sẻ từ một nhà nghiên cứu OpenAI rằng phiên bản toán học mạnh hơn sẽ ra mắt trong vài tháng tới.
Ngược lại, Deepseek lựa chọn công khai phương pháp và cấu trúc kỹ thuật của mô hình. Theo The Economist, chiến lược minh bạch này không chỉ giúp hãng tạo dấu ấn, mà còn gây áp lực cạnh tranh lên hệ sinh thái AI Mỹ, trong bối cảnh một số startup tại đây đã cân nhắc chuyển sang mô hình nguồn mở giá rẻ từ Trung Quốc để cắt giảm chi phí.













