GPT-5.2 ra mắt với nhiều cải tiến, Sam Altman hạ thấp Gemini 3

7 giờ trước Gốc

GPT-5.2 ra mắt sau khi CEO OpenAI ban hành 'báo động đỏ' nội bộ đầu tháng 12, tạm dừng các dự án không cốt lõi nhằm đối phó với Gemini 3.

Theo thông cáo của OpenAI, GPT-5.2 mang đến các cải tiến về năng lực trí tuệ tổng quát, khả năng lập trình và xử lý ngữ cảnh dài.

OpenAI cho biết GPT-5.2 dự kiến sẽ mang lại giá trị kinh tế lớn hơn nữa cho người dùng, vì tốt hơn trong việc tạo bảng tính, xây dựng bài thuyết trình và xử lý các dự án phức tạp nhiều bước.

“GPT-5.2 là dòng mô hình mạnh mẽ nhất từ trước đến nay dành cho công việc tri thức chuyên nghiệp. Hiện tại, người dùng ChatGPT Enterprise trung bình cho biết AI giúp họ tiết kiệm 40 - 60 phút mỗi ngày, và những người dùng chuyên sâu tiết kiệm hơn 10 giờ mỗi tuần. Chúng tôi phát triển GPT-5.2 nhằm tạo ra nhiều giá trị kinh tế hơn nữa cho mọi người. Mô hình này hoạt động tốt hơn trong việc tạo bảng tính, xây dựng bài thuyết trình, viết mã, phân tích hình ảnh, hiểu ngữ cảnh dài, sử dụng công cụ và xử lý các dự án phức tạp gồm nhiều bước”, OpenAI thông báo.

Theo “cha đẻ ChatGPT”, GPT-5.2 thiết lập tiêu chuẩn mới trên nhiều hệ đo lường, gồm cả GDPval, trong đó mô hình AI này vượt trội hơn các chuyên gia trong ngành ở những nhiệm vụ công việc đòi hỏi kiến thức chuyên sâu, trải rộng trên 44 ngành nghề.

Trong ChatGPT, phiên bản GPT-5.2 Instant, Thinking và Pro sẽ bắt đầu được triển khai từ hôm nay, với các gói trả phí trước tiên. Trên API, các phiên bản này hiện đã sẵn sàng cho mọi nhà phát triển.

Các đối tác của OpenAI là Notion, Box, Shopify, Harvey và Zoom ghi nhận rằng GPT-5.2 thể hiện năng lực suy luận dài hạn và khả năng gọi công cụ (tool-calling) ở mức dẫn đầu thị trường. Gọi công cụ là cơ chế cho phép mô hình AI tự động sử dụng các công cụ bên ngoài để hoàn thành nhiệm vụ thay vì chỉ trả lời bằng văn bản.

Databricks, Hex và Triple Whale đánh giá GPT-5.2 xuất sắc trong các nhiệm vụ khoa học dữ liệu mang tính chủ động và phân tích tài liệu.

Cognition, Warp, Charlie Labs, JetBrains và Augment Code cho biết GPT-5.2 mang lại hiệu năng vượt trội trong lập trình mang tính chủ động với các cải thiện rõ rệt ở những mảng như lập trình tương tác, rà soát mã, phát hiện lỗi.

"Tổng thể, GPT-5.2 mang đến những cải tiến đáng kể về năng lực trí tuệ tổng quát, khả năng xử lý ngữ cảnh dài, tác tử sử dụng công cụ và thị giác máy tính, giúp mô hình thực thi tốt hơn các nhiệm vụ phức tạp trong thế giới thực từ đầu đến cuối so với mọi phiên bản trước đó", OpenAI tuyên bố.

Theo OpenAI, GPT-5.2 là dòng mô hình AI mạnh mẽ nhất từ trước đến nay dành cho công việc tri thức chuyên nghiệp

Theo OpenAI, GPT-5.2 Thinking là mô hình AI tốt nhất hiện nay để sử dụng trong môi trường chuyên nghiệp và thực tế.

Trên GDPval - bộ đánh giá đo lường các nhiệm vụ công việc tri thức được mô tả rõ ràng trên 44 ngành nghề, GPT-5.2 Thinking thiết lập điểm số cao nhất và là mô hình đầu tiên của OpenAI đạt hoặc vượt mức chuyên gia. Cụ thể, theo đánh giá của các giám khảo là chuyên gia, GPT-5.2 Thinking vượt hoặc ngang bằng các chuyên gia hàng đầu trong ngành ở 70,9% các phép so sánh trên những nhiệm vụ công việc tri thức của GDPval. Các nhiệm vụ này gồm tạo bài thuyết trình, bảng tính và nhiều loại tài liệu khác.

GPT-5.2 Thinking tạo đầu ra cho các nhiệm vụ GDPval với tốc độ nhanh hơn 11 lần và chi phí thấp hơn dưới 1% so với chuyên gia. Điều này cho thấy rằng khi được kết hợp với sự giám sát của con người, GPT-5.2 có thể hỗ trợ đắc lực cho công việc chuyên môn.

Để sử dụng các khả năng tạo bảng tính và bài thuyết trình mới trong ChatGPT, bạn cần sử dụng gói Plus, Pro, Business hoặc Enterprise và chọn GPT-5.2 Thinking hoặc Pro. Các tác vụ phức tạp có thể mất nhiều phút để tạo.

GPT-5.2 vượt trội GPT-5.1 trên các tiêu chuẩn đánh giá

Về lập trình, GPT-5.2 Thinking thiết lập mức hiệu năng mới ở 55,6% trên SWE-Bench Pro, bộ đánh giá khắt khe về kỹ thuật phần mềm trong môi trường thực tế.

Jeff Wang, Giám đốc điều hành Windsurf, nhận xét: “GPT-5.2 là bước nhảy lớn nhất với các mô hình GPT trong lập trình theo hướng chủ động kể từ GPT-5, và là mô hình lập trình dẫn đầu trong tầm giá của nó. Việc chỉ tăng số phiên bản không phản ánh hết mức độ cải thiện về trí tuệ. Chúng tôi rất háo hức đưa nó trở thành mặc định trên Windsurf và nhiều tác vụ cốt lõi của Devin (hệ thống AI kỹ sư phần mềm tự động)”.

Chưa hết, GPT-5.2 Thinking bị ảo giác (đưa ra câu trả lời sai y như thật) hơn GPT-5.1 Thinking. Với người dùng chuyên nghiệp, điều này đồng nghĩa với việc ít sai sót hơn khi dùng GPT-5.2 Thinking để nghiên cứu, viết lách, phân tích và hỗ trợ ra quyết định, giúp mô hình đáng tin cậy hơn cho công việc tri thức hằng ngày.

Theo OpenAI, GPT-5.2 Thinking là mô hình thị giác mạnh nhất của công ty cho đến nay, giảm khoảng một nửa tỷ lệ lỗi trong suy luận biểu đồ và hiểu giao diện phần mềm. Với người dùng chuyên nghiệp, GPT-5.2 Thinking diễn giải chính xác hơn bảng điều khiển (dashboard), ảnh chụp sản phẩm, sơ đồ kỹ thuật và báo cáo trực quan, hữu ích trong các quy trình tài chính, vận hành, kỹ thuật, thiết kế và hỗ trợ khách hàng, nơi thông tin hình ảnh đóng vai trò chủ đạo.

OpenAI thông báo hiện không có kế hoạch loại bỏ GPT-5.1, GPT-5 hoặc GPT-4.1 khỏi giao diện lập trình ứng dụng của mình.

“Gemini 3 ảnh hưởng không nhiều đến các chỉ số của OpenAI so với lo ngại ban đầu”

Hồi tháng 11, Google đã ra mắt phiên bản Gemini 3 với những cải tiến đáng giá và nhấn mạnh vị trí dẫn đầu của mô hình này trên một số bảng xếp hạng đo lường hiệu suất phổ biến trong ngành.

Thế nhưng, Sam Altman (Giám đốc điều hành OpenAI) nói trong cuộc phỏng vấn với kênh CNBC hôm 11.12: “Gemini 3 gây ít ảnh hưởng đến các chỉ số của chúng tôi hơn so với lo ngại ban đầu”.

Hôm 11.12, Disney cho biết đang đầu tư 1 tỉ USD vào OpenAI và sẽ cho phép công ty khởi nghiệp AI này sử dụng các nhân vật từ các thương hiệu Star Wars, Pixar, Marvel trong trình tạo video AI Sora của mình.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/gpt-5-2-ra-mat-voi-nhieu-cai-tien-sam-altman-ha-thap-gemini-3-242247.html