Người dùng ChatGPT đã có thể sử dụng mô hình o3-mini: Khả năng suy luận tốt hơn, miễn phí cũng dùng được
OpenAI vừa công bố o3-mini, mô hình suy luận trí tuệ nhân tạo (AI) thế hệ mới. Điểm nổi bật, o3-mini không chỉ tích hợp trong các dịch vụ API mà còn có mặt trên phiên bản ChatGPT miễn phí, mở ra khả năng tiếp cận rộng rãi cho người dùng. Sự ra mắt này diễn ra trong bối cảnh cạnh tranh ngày càng gay gắt trong lĩnh vực AI, đặc biệt với sự nổi lên của các công ty Trung Quốc như DeepSeek.
OpenAI đang phải đối mặt với thách thức từ các đối thủ, đồng thời tìm cách củng cố vị thế của mình thông qua các dự án đầy tham vọng. o3-mini được giới thiệu như một giải pháp “mạnh mẽ” với giá cả “phải chăng”, thể hiện nỗ lực của OpenAI trong việc phổ cập AI tiên tiến.
Được công bố lần đầu tiên trong sự kiện “12 ngày ship-mas” của OpenAI vào tháng 12, o3-mini được thiết kế để đạt hiệu suất tương đương o1 trong các lĩnh vực toán học, lập trình và khoa học, đồng thời phản hồi nhanh hơn. OpenAI cho biết o3-mini nhanh hơn o1-mini 24% và cung cấp câu trả lời chính xác hơn. Tương tự o1-mini, o3-mini cũng sẽ hiển thị cách thức tìm ra câu trả lời, thay vì chỉ đưa ra kết quả cuối cùng.
Không giống như các mô hình ngôn ngữ lớn thông thường, o3-mini tự kiểm tra tính xác thực trước khi đưa ra kết quả, giúp giảm thiểu các lỗi thường gặp. Mặc dù quá trình này có thể mất nhiều thời gian hơn, nhưng đổi lại, o3-mini mang lại độ tin cậy cao hơn, đặc biệt trong các lĩnh vực như vật lý.
Trong lĩnh vực toán học, ở mức nỗ lực suy luận thấp, o3-mini đạt hiệu suất tương đương o1-mini. Ở mức nỗ lực trung bình, hiệu suất của o3-mini tương đương o1. Đáng chú ý, khi nỗ lực suy luận được nâng lên mức cao, o3-mini vượt trội hơn cả o1-mini lẫn o1. Vùng tô xám trên biểu đồ thể hiện hiệu suất của phương pháp biểu quyết đa số (đồng thuận) với 64 mẫu.
o3-mini được tinh chỉnh cho các bài toán STEM, bao gồm lập trình, toán học và khoa học. OpenAI tuyên bố mô hình này có khả năng tương đương dòng o1 (o1 và o1-mini), nhưng vượt trội về tốc độ và chi phí.
Kết quả thử nghiệm cho thấy người dùng thích câu trả lời của o3-mini hơn o1-mini trong hơn một nửa số trường hợp. o3-mini cũng giảm 39% “lỗi lớn” trong các câu hỏi thực tế so với o1-mini, đồng thời cung cấp câu trả lời “rõ ràng hơn” và nhanh hơn 24%.
Người dùng trả phí (ChatGPT Plus và Team) sẽ được hưởng giới hạn truy vấn cao hơn (150 truy vấn/ngày), trong khi người dùng ChatGPT Pro được truy cập không giới hạn. Người dùng miễn phí có thể trải nghiệm o3-mini thông qua nút “Lý do” (Reason) trong thanh trò chuyện.
o3-mini cũng sẽ có sẵn qua API của OpenAI cho các nhà phát triển, nhưng ban đầu sẽ không hỗ trợ phân tích hình ảnh. Các nhà phát triển có thể tùy chọn mức “nỗ lực suy luận” (thấp, trung bình, cao) để điều chỉnh hiệu suất.
Về giá cả, o3-mini có giá 0,55 đô la cho mỗi triệu mã thông báo đầu vào và 4,40 đô la cho mỗi triệu mã thông báo đầu ra (khoảng 750.000 từ). Mức giá này rẻ hơn 63% so với o1-mini và cạnh tranh với mô hình R1 của DeepSeek (0,14 đô la cho mỗi triệu mã thông báo đầu vào và 2,19 đô la cho mỗi triệu mã thông báo đầu ra).
Trong ChatGPT, o3-mini mặc định ở mức nỗ lực suy luận trung bình. Người dùng trả phí có thể chọn “o3-mini-high” để có “trí thông minh cao hơn” với tốc độ chậm hơn. Dù người dùng chọn phiên bản nào, o3-mini cũng sẽ tích hợp tìm kiếm để cung cấp câu trả lời kèm theo liên kết nguồn web. Tuy nhiên, OpenAI lưu ý rằng tính năng này vẫn đang trong giai đoạn thử nghiệm.
“Trong khi o1 vẫn là mô hình suy luận kiến thức chung rộng rãi hơn, o3-mini cung cấp một giải pháp thay thế chuyên biệt cho các lĩnh vực kỹ thuật đòi hỏi độ chính xác và tốc độ,” OpenAI cho biết.