xAI của tỷ phú Elon Musk ra mắt Grok 4 vượt trình độ tiến sĩ
Công ty trí tuệ nhân tạo xAI của tỷ phú Elon Musk vừa công bố mô hình AI chủ lực mới nhất, Grok 4, đồng thời giới thiệu gói thuê bao AI mới với giá 300 USD/tháng, mang tên SuperGrok Heavy.
Grok được coi là câu trả lời của xAI đối với các mô hình như ChatGPT của OpenAI và Gemini của Google, với khả năng phân tích hình ảnh và trả lời câu hỏi. Trong vài tháng gần đây, Grok đã được tích hợp sâu hơn vào mạng xã hội X của tỷ phú Elon Musk, vốn vừa được xAI mua lại. Tuy nhiên, điều này cũng khiến những hành vi không đúng mực của Grok trở thành tâm điểm chú ý của hàng triệu người dùng.

xAI giới thiệu Grok 4 vượt trình độ tiến sĩ ở tất cả các môn học.
Kỳ vọng dành cho Grok 4 rất cao, khi mô hình AI mới nhất của xAI sẽ được so sánh với GPT-5 của OpenAI, dự kiến ra mắt vào cuối mùa hè này. Trong buổi livestream tối thứ Tư (giờ Mỹ), ông Elon Musk tuyên bố: "Với các câu hỏi học thuật, Grok 4 vượt trội hơn trình độ tiến sĩ ở mọi môn học, không có ngoại lệ. Tuy nhiên, đôi khi nó thiếu ý thức thông thường, và chưa phát minh ra công nghệ mới hay khám phá vật lý mới, nhưng đó chỉ là vấn đề thời gian".
Sự ra mắt Grok 4 diễn ra trong một tuần đầy biến động đối với các công ty của ông Musk. Cùng ngày, Linda Yaccarino đã từ chức CEO của X sau khoảng 2 năm đảm nhiệm vai trò này. X vẫn chưa công bố người kế nhiệm. Việc cô Yaccarino rời đi diễn ra chỉ vài ngày sau khi tài khoản X chính thức của Grok, hoạt động tự động, phản hồi người dùng bằng những bình luận bài Do Thái, chỉ trích "các giám đốc điều hành Do Thái" tại Hollywood. xAI đã phải tạm thời hạn chế tài khoản của Grok và xóa các bài đăng gây tranh cãi. Đáp lại sự việc, xAI dường như đã xóa một phần hướng dẫn công khai gần đây của Grok.
Tỷ phú Elon Musk và các lãnh đạo xAI hầu như tránh đề cập đến sự cố này, thay vào đó tập trung vào hiệu suất và khả năng của Grok 4.
xAI đã ra mắt hai mô hình: Grok 4 và Grok 4 Heavy - phiên bản "đa tác nhân" với hiệu suất cao hơn. Musk cho biết Grok 4 Heavy tạo ra nhiều tác nhân AI làm việc đồng thời trên một vấn đề, sau đó so sánh kết quả "như một nhóm học tập" để tìm ra câu trả lời tốt nhất.
xAI tuyên bố Grok 4 đạt hiệu suất hàng đầu trên nhiều bài kiểm tra, bao gồm Humanity's Last Exam - một bài kiểm tra khó đánh giá khả năng trả lời hàng ngàn câu hỏi từ cộng đồng về toán học, nhân văn và khoa học tự nhiên. Theo xAI, Grok 4 đạt 25,4% điểm trên bài kiểm tra này mà không sử dụng "công cụ hỗ trợ," vượt qua Gemini 2.5 Pro của Google (21,6%) và mô hình o3 (high) của OpenAI (21%). Với "công cụ hỗ trợ," Grok 4 Heavy đạt 44,4%, vượt xa Gemini 2.5 Pro (26,9%).
Tổ chức phi lợi nhuận Arc Prize cho biết Grok đạt điểm số cao nhất từ trước đến nay trên bài kiểm tra ARC-AGI-2, một bài kiểm tra khó gồm các câu đố yêu cầu AI nhận diện mẫu hình thị giác, với điểm số 16,2%, gần gấp đôi mô hình AI thương mại tốt nhất tiếp theo, Claude Opus 4.
Cùng với Grok 4 và Grok 4 Heavy, xAI ra mắt gói thuê bao AI đắt nhất từ trước đến nay, SuperGrok Heavy, với giá 300 USD/tháng. Người đăng ký gói này sẽ được trải nghiệm trước Grok 4 Heavy và tiếp cận sớm các tính năng mới. Gói này tương tự các gói cao cấp của OpenAI, Google và Anthropic, nhưng xAI hiện cung cấp gói thuê bao đắt nhất trong số các nhà cung cấp AI lớn.
Người dùng SuperGrok Heavy có thể được tiếp cận sớm một số sản phẩm mới mà xAI dự kiến ra mắt trong vài tháng tới, bao gồm mô hình mã hóa AI vào tháng 8, tác nhân đa phương thức vào tháng 9 và mô hình tạo video vào tháng 10.
xAI đang phát hành Grok 4 thông qua API để khuyến khích các nhà phát triển xây dựng ứng dụng với mô hình này. Công ty cho biết mảng doanh nghiệp của xAI chỉ mới ra đời hai tháng, nhưng họ dự kiến hợp tác với các nhà cung cấp đám mây lớn để đưa Grok lên các nền tảng của họ.
Dù Grok đạt hiệu suất hàng đầu trên các bài kiểm tra, xAI có thể gặp khó khăn trong việc vượt qua các sự cố gần đây khi cố gắng thuyết phục doanh nghiệp rằng Grok là đối thủ thực sự của ChatGPT, Claude và Gemini. Liệu các doanh nghiệp có sẵn sàng chấp nhận Grok, với những lỗi lầm của nó, hay không vẫn là một câu hỏi còn bỏ ngỏ.