So sánh GPT-5.3-Codex của OpenAI và Claude Opus 4.6 của Anthropic

7 giờ trước Gốc

Đấu trường trí tuệ nhân tạo tuần qua vừa chứng kiến hai gã khổng lồ OpenAI và Anthropic lần lượt tung ra quân bài chiến lược GPT-5.3-Codex và Claude Opus 4.6.

Trong khi GPT-5.3 hướng tới việc nâng cấp tính đa nhiệm cao hơn thì Claude Opus 4.6 lại đặt trọng tâm vào các suy luận sâu

Không còn là những màn so găng về khả năng trò chuyện đơn thuần, cuộc đua giờ đây đã chuyển sang một giai đoạn mới khốc liệt hơn: kỷ nguyên của các "tác tử AI" (AI agents) có khả năng tự chủ cao trong công việc chuyên môn.

Dưới sự dẫn dắt của Sam Altman, OpenAI đã giới thiệu GPT-5.3-Codex, một mô hình mà họ tự tin tuyên bố là "mô hình lập trình tác nhân có năng lực nhất cho đến nay", vượt xa phạm vi viết mã thông thường để xử lý cả nghiên cứu và quy trình làm việc phức tạp. Gần như ngay lập tức, đối thủ sừng sỏ Anthropic cũng "ăn miếng trả miếng" với sự ra mắt của Claude Opus 4.6, tập trung vào khả năng suy luận sâu và xử lý các tác vụ dài hơi.

GPT-5.3-Codex: Khi AI trở thành đồng nghiệp thực thụ

Điểm nhấn quan trọng nhất trong lần ra mắt này của OpenAI không chỉ nằm ở tốc độ hay độ chính xác, mà là sự thay đổi về chất trong cách AI tương tác với công việc. GPT-5.3-Codex đánh dấu bước chuyển mình từ một công cụ hỗ trợ viết và kiểm tra mã đơn thuần sang một tác nhân có thể thực hiện gần như mọi tác vụ máy tính mà một lập trình viên hoặc chuyên gia thường làm.

OpenAI cho biết GPT-5.3-Codex là sự kết hợp sức mạnh giữa khả năng lập trình tiên tiến của phiên bản tiền nhiệm với tư duy suy luận mạnh mẽ và kiến thức chuyên môn sâu rộng của GPT-5.2. Kết quả là một hệ thống thống nhất với tốc độ xử lý nhanh hơn ít nhất 25% so với các mô hình trước đó. Khả năng "agentic" (tác tử) cho phép mô hình này đảm đương các nhiệm vụ dài và phức tạp, bao gồm tự nghiên cứu thông tin, chỉnh sửa tệp tin, quản lý quy trình làm việc và sử dụng các công cụ hỗ trợ.

Điều khiến giới công nghệ thực sự ấn tượng là khả năng cộng tác của mô hình mới. Các lập trình viên có thể tương tác và hướng dẫn GPT-5.3-Codex trong suốt quá trình làm việc, giống như đang trao đổi với một đồng nghiệp thực thụ mà không lo AI bị mất ngữ cảnh giữa chừng. Phạm vi hoạt động của nó bao trùm toàn bộ vòng đời phát triển phần mềm, từ viết Tài liệu Yêu cầu Sản phẩm (PRD), nghiên cứu người dùng, gỡ lỗi, triển khai, giám sát hệ thống cho đến phân tích dữ liệu trong các bảng tính.

Một chi tiết thú vị mang tính biểu tượng là chính các phiên bản sơ khai của GPT-5.3-Codex đã tham gia vào việc gỡ lỗi quá trình đào tạo và phân tích kết quả thử nghiệm của chính nó, biến nó thành mô hình đầu tiên "đóng góp có ý nghĩa vào sự ra đời của chính mình". Hiện tại, mô hình này đã có sẵn cho tất cả người dùng ChatGPT trả phí trên mọi nền tảng.

Cuộc đối đầu trực diện và tương lai của quản lý nhân sự AI

Không chịu lép vế trước đối thủ, Anthropic cũng chọn cùng ngày để tung ra Claude Opus 4.6, làm nóng thêm bầu không khí cạnh tranh gay gắt. Theo tuyên bố của Anthropic, Opus 4.6 là một phiên bản nâng cấp toàn diện dựa trên người tiền nhiệm, với khả năng lập trình mạnh mẽ hơn hẳn. Khác với sự đa năng và tốc độ của OpenAI, Anthropic dường như định vị Opus 4.6 là một chuyên gia giải quyết các vấn đề hóc búa. Mô hình này được thiết kế để lập kế hoạch cẩn thận, xử lý các tác vụ tác nhân chạy trong thời gian dài một cách đáng tin cậy hơn, đặc biệt hiệu quả khi làm việc trong các cơ sở mã (codebase) khổng lồ và cung cấp khả năng đánh giá mã được cải thiện.

Sự ra mắt song song này đã dẫn đến những thảo luận thú vị về triết lý phát triển của hai công ty. Trong một podcast ngay sau sự kiện, Sam Altman của OpenAI và Sholto Douglas, một nhà nghiên cứu hàng đầu của Anthropic, đã có những chia sẻ đáng chú ý. Douglas nhận định rằng trước đây, các mô hình của OpenAI thường mạnh về việc nỗ lực giải quyết các vấn đề thực sự khó khăn, trong khi Anthropic lại có lợi thế về tốc độ.

Tuy nhiên, vai trò dường như đang có sự đảo chiều hoặc hội tụ khi OpenAI tập trung cải thiện tốc độ đáng kể cho mô hình mới, còn Anthropic lại dồn lực để làm cho AI của họ giải quyết các vấn đề "cực kỳ khó khăn" tốt hơn nhiều.

Kết lại cuộc thảo luận, Sam Altman đã vẽ nên một viễn cảnh tương lai nơi vai trò của con người sẽ thay đổi căn bản. Ông tin rằng chúng ta đang hướng tới một quy trình làm việc nơi nhiều người sẽ cảm thấy họ đang đóng vai trò quản lý một đội ngũ các tác nhân AI. Khi các tác nhân này ngày càng giỏi hơn, chúng sẽ tiếp tục hoạt động ở mức độ trừu tượng ngày càng cao, giải phóng con người khỏi các chi tiết kỹ thuật để tập trung vào chiến lược và giám sát cấp cao.

Bùi Tú

Nguồn Một Thế Giới: https://1thegioi.vn/so-sanh-gpt-5-3-codex-cua-openai-va-claude-opus-4-6-cua-anthropic-245923.html