So sánh khả năng sáng tạo giữa GPT-5.2 và Grok 4.1

Chuyên trang Sài Gòn Đầu Tư Tài Chính - Báo Sài Gòn Giải Phóng

2 giờ trước Gốc

Ngay sau lễ kỷ niệm 10 năm thành lập, OpenAI đã ra mắt GPT-5.2, thế hệ mô hình AI mới nhất dành cho ChatGPT, trong bối cảnh cạnh tranh trên thị trường trí tuệ nhân tạo ngày càng gay gắt.

Ảnh minh họa: AI

Theo giới quan sát, cuộc đua hiện nay không chỉ dừng ở khả năng trò chuyện mà còn mở rộng sang hiệu năng tổng thể, khả năng suy luận, sáng tạo nội dung và hệ sinh thái sản phẩm đi kèm. Trong bức tranh đó, GPT-5.2 và Grok 4.1 được xem là 2 đại diện tiêu biểu của 2 hướng tiếp cận khác nhau.

Về xếp hạng và benchmark (điểm chuẩn), GPT-5.2 hiện vẫn còn khá mới nên chưa xuất hiện đầy đủ trên các bảng xếp hạng độc lập như LMArena. Tuy nhiên, theo công bố từ OpenAI, mô hình này vượt GPT-5.1 vài điểm phần trăm ở hầu hết các chỉ số.

Dựa trên giả định GPT-5.2 sẽ thay thế GPT-5.1 trên bảng xếp hạng, giới phân tích cho rằng GPT-5.2 nhiều khả năng nằm trong nhóm dẫn đầu ở phần lớn hạng mục. Ở chỉ số WebDev, nơi GPT-5.2 đã xuất hiện, mô hình này đang xếp thứ 2, đứng trên Grok.

Điểm chuẩn

Trong các bài kiểm tra benchmark do OpenAI tự công bố, GPT-5.2 cho kết quả vượt trội so với Grok 4.1 ở nhiều lĩnh vực. Ở bài kiểm tra Creative Writing v3, GPT-5.2 đạt điểm ELO 1.675,5, cao hơn đáng kể so với mức 1.268,6 của Grok 4.1.

Tại GDPval-AA, GPT-5.2 đạt 1.474 điểm, trong khi Grok chỉ đạt 1.041. Khoảng cách thu hẹp hơn ở GPQA Diamond, với GPT-5.2 đạt 90,3% so với 87,7% của Grok.

Với các bài toán toán học như AIME 2025 hay FrontierMath, GPT-5.2 tiếp tục cho thấy độ chính xác cao hơn. Dù vậy, các chuyên gia lưu ý rằng benchmark chỉ phản ánh một phần năng lực và trải nghiệm thực tế có thể khác nhau tùy mục đích sử dụng.

Tính năng

Xét về khả năng tiếp cận và tính năng, cả GPT-5.2 và Grok 4.1 đều được cung cấp thông qua nền tảng chatbot riêng, hỗ trợ tạo văn bản và hình ảnh. ChatGPT có lợi thế khi tích hợp sâu vào nhiều sản phẩm và dịch vụ khác nhau của OpenAI, đồng thời hỗ trợ tạo video thông qua Sora 2.

Trong khi đó, Grok cung cấp khả năng tạo hình ảnh và video thông qua nền tảng Grok Imagine. Tuy nhiên, cả hai vẫn bị đánh giá là chưa theo kịp các công cụ tạo video chuyên biệt như Veo 3 của Google hay Ray3 của LumaAI.

Giá thành

Về giá thành, GPT-5.2 hiện yêu cầu người dùng đăng ký gói ChatGPT trả phí, với mức khởi điểm 20 USD mỗi tháng và các gói cao hơn lên tới 200 USD. Với Grok, người dùng cần đăng ký gói SuperGrok để truy cập Grok 4.1, với mức giá từ 30 USD đến 300 USD mỗi tháng tùy mức độ sử dụng. Sự chênh lệch này khiến GPT-5.2 được đánh giá là có lợi thế nhất định về chi phí.

Tổng thể, GPT-5.2 cho thấy ưu thế rõ rệt về benchmark và giá khởi điểm, trong khi Grok 4.1 vẫn giữ vị trí ổn định trên nhiều bảng xếp hạng và có cộng đồng người dùng riêng.

Giới phân tích cho rằng lựa chọn nền tảng phù hợp vẫn phụ thuộc vào nhu cầu cụ thể của từng cá nhân và doanh nghiệp, bởi hiệu năng trên giấy tờ không phải lúc nào cũng phản ánh trọn vẹn hiệu quả trong thực tế.

Vinh Trang - Mashable

Nguồn SGĐT: https://dttc.sggp.org.vn/so-sanh-kha-nang-sang-tao-giua-gpt-52-va-grok-41-post129574.html