Lập trình viên đánh bại mô hình AI tiên tiến của OpenAI ở giải vô địch thế giới: 'Loài người đã thắng'

Przemysław Dębiak gần như đã kiệt sức khi thực hiện điều có thể sớm trở nên bất khả thi trong tương lai: Đánh bại mô hình trí tuệ nhân tạo (AI) tiên tiến của OpenAI trong cuộc thi lập trình đối đầu trực tiếp.

Điểm đáng chú ý: Przemysław Dębiak, lập trình viên người Ba Lan, là cựu nhân viên OpenAI - công ty khởi nghiệp AI hàng đầu thế giới tạo ra chatbot ChatGPT.

Przemysław Dębiak đã vượt qua mô hình AI tiên tiến của OpenAI (Mỹ) tại cuộc thi Heuristic Contest trong khuôn khổ AtCoder World Tour Finals 2025 do công ty Mỹ này tài trợ, và giành được giải thưởng 500.000 yên (khoảng 3.367 USD).

OpenAI không nêu rõ tên mô hình AI tùy chỉnh của mình trong cuộc thi này, mà đặt biệt danh cho nó là OpenAIAHC.

Được tổ chức ở Tokyo (thủ đô Nhật Bản), AtCoder World Tour Finals là một trong những sự kiện lập trình cạnh tranh danh giá nhất, chỉ mời 12 lập trình viên hàng đầu thế giới, được chọn dựa trên thành tích cả năm.

Przemysław Dębiak đánh bại mô hình AI tiên tiến của OpenAI trong cuộc thi đối đầu trực tiếp - Ảnh: X

Przemysław Dębiak đánh bại mô hình AI tiên tiến của OpenAI trong cuộc thi đối đầu trực tiếp - Ảnh: X

Cuộc thi Heuristic Contest được tổ chức hàng năm bởi AtCoder - nền tảng lập trình thi đấu trực tuyến có trụ sở tại Nhật Bản, rất nổi tiếng trên toàn thế giới, đặc biệt là với những người yêu thích thuật toán và tối ưu hóa.

Heuristic Contest yêu cầu thí sinh giải một bài toán tối ưu hóa phức tạp duy nhất trong vòng 600 phút (10 tiếng). Trong lập trình, heuristic là cách giải gần đúng, sử dụng mẹo và phán đoán thay vì tính toán hoàn hảo.

Tất cả thí sinh, gồm cả OpenAI, đều được sử dụng phần cứng giống hệt nhau do AtCoder cung cấp, đảm bảo sân chơi công bằng giữa người và AI. Theo quy định, thí sinh có thể dùng bất kỳ ngôn ngữ lập trình nào có trên hệ thống AtCoder, không bị trừ điểm nếu nộp lại bài, nhưng phải chờ 5 phút giữa các lần nộp.

Heuristic Contest khác với các cuộc thi lập trình thuật toán truyền thống. Trong các cuộc thi thuật toán thông thường, mục tiêu là tìm ra lời giải chính xác 100% và tối ưu nhất cho một bài toán với giới hạn thời gian và bộ nhớ nhất định.

Ngược lại, thí sinh tại Heuristic Contest tập trung vào việc tìm ra lời giải tốt nhất có thể trong một khoảng thời gian giới hạn, khi việc tìm ra lời giải tối ưu tuyệt đối là quá khó hoặc không khả thi. Các đặc điểm chính của Heuristic Contest bao gồm:

Phức tạp: Thường là các bài toán tối ưu hóa hoặc tìm kiếm có không gian lời giải cực kỳ lớn, không thể duyệt hết.

Lời giải gần đúng: Thí sinh không cần tìm ra lời giải hoàn hảo, mà là lời giải đủ tốt, gần với tối ưu nhất có thể.

Đánh giá theo điểm số: Thay vì đúng hoặc sai, lời giải của thí sinh được chấm điểm dựa trên chất lượng của nó (ví dụ tối ưu được bao nhiêu...). Điểm càng cao thì lời giải càng tốt.

Chiến lược heuristic: Thí sinh cần phát triển các thuật toán heuristic (tìm kiếm theo kinh nghiệm, không đảm bảo tối ưu nhưng hiệu quả trong thực tế) hoặc metaheuristic (phương pháp tổng quát hơn để tìm kiếm lời giải gần đúng) để giải quyết vấn đề. Ví dụ như thuật toán tham lam, tìm kiếm cục bộ, thuật toán di truyền, giả lập luyện kim,…

Thuật toán tham lam là chiến lược giải bài toán bằng cách luôn chọn phương án tốt nhất tại từng bước nhỏ, với hy vọng rằng toàn bộ lời giải sẽ là tốt nhất. Nói đơn giản, thuật toán tham lam “ăn chắc phần ngon trước”, chọn phương án tối ưu cục bộ tại mỗi bước, mà không xét toàn cục.

Thuật toán di truyền là thuật toán tối ưu hóa gần đúng thuộc nhóm metaheuristic, lấy cảm hứng từ quá trình tiến hóa tự nhiên và di truyền sinh học. Nó mô phỏng quá trình chọn lọc tự nhiên, nơi các cá thể “tốt” có nhiều khả năng sống sót, lai ghép và đột biến để tạo ra các thế hệ mới ngày càng tối ưu hơn.

Giả lập luyện kim là thuật toán tối ưu hóa gần đúng được lấy cảm hứng từ quá trình luyện kim trong vật lý, trong đó một kim loại được nung nóng rồi làm nguội dần để đạt trạng thái ổn định năng lượng thấp nhất (tức là cấu trúc bền nhất).

Thời gian thực thi: Thường có giới hạn thời gian thực thi nghiêm ngặt cho mỗi lần chạy chương trình, buộc thí sinh phải tối ưu hóa mã lệnh và thuật toán của mình để đạt được kết quả tốt nhất trong khoảng thời gian đó.

Thử nghiệm và điều chỉnh: Yêu cầu nhiều lần thử nghiệm, điều chỉnh tham số của thuật toán và đánh giá hiệu suất để cải thiện điểm số.

Tóm lại, Heuristic Contest kiểm tra khả năng của lập trình viên trong việc thiết kế và triển khai các thuật toán hiệu quả để giải quyết các vấn đề phức tạp, trong điều kiện ràng buộc về thời gian cùng sự chính xác tuyệt đối không phải là ưu tiên hàng đầu. Điều đó đòi hỏi sự sáng tạo, kinh nghiệm và khả năng thực nghiệm cao hơn so với các cuộc thi lập trình thuật toán thuần túy.

“Dốc 100% khả năng và chỉ cố gắng trụ vững”

“Tôi đã rất mệt mỏi và có lúc nghĩ mình nên nghỉ ngơi. Thế nhưng khi đó, tôi lại rất gần với điểm số của mô hình AI”, Przemysław Dębiak (41 tuổi, thi đấu dưới biệt danh Psyho), chia sẻ qua cuộc gọi video với trang Insider hôm 18.7.

Điều đó thúc đẩy anh nỗ lực hết mình và sức lực còn lại để đánh bại AI. “Tôi đã cố gắng dốc 100% khả năng và chỉ cố gắng trụ vững”, Przemysław Dębiak chia sẻ và nói thêm rằng nếu không có mô hình AI của OpenAI cạnh tranh thì “điểm số của tôi hẳn sẽ thấp hơn rất nhiều”.

Chiến thắng của Przemysław Dębiak đã thu hút sự chú ý từ Giám đốc điều hành OpenAI - Sam Altman. Trong một bài đăng trên mạng xã hội X, Sam Altman viết: “Làm tốt lắm Psyho”.

Khi được trang Insider liên hệ, phía OpenAI đã chỉ vào một bài đăng trên X: “Mô hình AI của chúng tôi đã giành hạng nhì tại AtCoder Heuristics World Finals! Chúc mừng nhà vô địch vì đã vượt qua chúng tôi lần này”.

Mô hình AI của OpenAI, được mô tả là mô hình lập luận tùy chỉnh tương tự như o3, đã xếp hạng nhì chung cuộc, vượt qua 10 lập trình viên khác đã lọt vào vòng chung kết sau cả năm thi đấu.

Đại diện OpenAI nhận xét đây là một cột mốc quan trọng trong hành trình đưa mô hình AI vào các cuộc thi lập trình cạnh tranh: “Các mô hình như o3 hiện đã lọt vào top 100 trong các cuộc thi lập trình và toán. Song theo chúng tôi biết, đây là lần đầu tiên mô hình AI lọt top 3 tại một cuộc thi lập trình hàng đầu”.

“Các sự kiện như AtCoder cho chúng tôi cơ hội để kiểm tra xem mô hình có thể lập kế hoạch dài hạn, suy luận chiến lược và cải thiện lời giải thông qua thử và sai, giống con người hay không”, phát ngôn viên OpenAI chia sẻ với trang AT.

Thử và sai (trial and error) là phương pháp giải quyết vấn đề cơ bản và trực quan, trong đó một người hoặc hệ thống sẽ thực hiện nhiều lần thử các giải pháp khác nhau cho đến khi tìm được giải pháp hoạt động hoặc chấp nhận được.

Khả năng lập trình của AI đã cải thiện

Dù OpenAI có vẻ lạc quan về ý nghĩa của cuộc thi, không thể phủ nhận rằng khả năng lập trình của AI đã cải thiện trong vài năm gần đây.

Chẳng hạn, Báo cáo Chỉ số AI 2025 của Đại học Stanford (Mỹ) cho thấy vào năm 2023, các hệ thống AI chỉ giải được 4,4% bài tập lập trình trong benchmark SWE-bench. Song đến năm 2024, con số đó đã nhảy vọt lên 71,7%

SWE-bench là bộ đánh giá tiêu chuẩn dùng để đo lường khả năng hiểu, sửa lỗi và cải tiến mã nguồn thực tế của các mô hình AI trong bối cảnh kỹ sư phần mềm thực thụ.

Lập trình hiện là một trong những ứng dụng phổ biến nhất của chatbot AI từ OpenAI, Anthropic, Google và Meta Platforms. Công cụ như Microsoft GitHub Copilot và Cursor đã trở thành tiêu chuẩn với các lập trình viên chuyên nghiệp.

Theo khảo sát của nền tảng GitHub năm 2024, hơn 90% lập trình viên đang sử dụng công cụ AI trong quy trình làm việc, dù một số nghiên cứu gần đây cho thấy AI không tiết kiệm được thời gian nhiều như tưởng tượng.

“Loài người đã chiến thắng”

Yoichi Iwata, quản trị viên Heuristic Contest, cho biết với Insider rằng mô hình AI của OpenAI đã vượt trội so với những người tham gia sử dụng các phương pháp tiếp cận tương tự như nó, nhưng Przemysław Dębiak lại “tìm ra một giải pháp hoàn toàn khác”.

“Chúng tôi kỳ vọng con người sẽ thắng, nhưng vẫn khá ngạc nhiên khi AI giành được vị trí thứ hai. Dù AI vượt trội về khả năng tối ưu hóa, chúng tôi tin rằng nó vẫn chưa đạt tới sự sáng tạo của con người”, Yoichi Iwata nói thêm.

Trang kết quả chính thức của cuộc thi cho thấy Przemysław Dębiak vượt qua các đối thủ đến từ Nhật Bản, Georgia và Pháp. Hôm 18.7, Przemysław Dębiak đã chia sẻ ảnh chụp màn hình bảng xếp hạng lên X, cho thấy anh giành chiến thắng và mô hình OpenAI đứng thứ hai.

“Kết quả đã là chính thức và khoảng cách giữa tôi với AI đã tăng từ 5,5% lên 9,5%”, anh viết.

Bảng xếp hạng cuối cùng của cuộc thi Heuristic Contest cho thấy Przemysław Dębiak đứng đầu - Ảnh: AtCoder

Bảng xếp hạng cuối cùng của cuộc thi Heuristic Contest cho thấy Przemysław Dębiak đứng đầu - Ảnh: AtCoder

Sau chiến thắng, Przemysław Dębiak đã tuyên bố: “Loài người đã chiến thắng (ít nhất là lúc này!)”, đồng thời nói thêm rằng anh “hoàn toàn kiệt sức” sau khi chỉ ngủ 10 tiếng trong 3 ngày. Anh cho biết mình đã bay từ Warsaw (thủ đô Ba Lan) sang Tokyo để tham gia thi đấu.

Trên X, Przemysław Dębiak tiết lộ không sử dụng công cụ AI, mà chỉ dùng Visual Studio Code, với “vài gợi ý tự động hoàn thành cơ bản để tăng tốc những thao tác lặp đi lặp lại”.

Visual Studio Code là trình soạn thảo mã miễn phí và mã nguồn mở, được phát triển bởi Microsoft, rất phổ biến trong cộng đồng lập trình viên.

Przemysław Dębiak nói anh chỉ biết về sự tham gia của mô hình AI từ OpenAI một tuần trước cuộc thi.

"Không ai biết rằng đây sẽ là trận đấu biểu diễn giữa con người và AI, ở một mức độ nào đó", anh thổ lộ.

Những yếu tố thuận lợi nghiêng về phía con người

AI sẽ thắng trong những tình huống yêu cầu kỹ thuật thuần túy, như triển khai thuật toán, giải bài toán và tối ưu mã, vì đơn giản là nó nhanh hơn, Przemysław Dębiak chia sẻ với Insider. Song trong những cuộc thi kéo dài, nơi lập trình viên phải làm mọi thứ từ đầu, AI sẽ gặp khó khăn hơn để bắt kịp.

“Cuộc thi càng kéo dài, khả năng chiến thắng của con người càng cao, còn AI càng gặp bất lợi”, Przemysław Dębiak nói. Lập trình viên người Ba Lan cho biết anh đã vượt qua mô hình AI của OpenAI vào cuối cuộc thi kéo dài 10 tiếng.

Przemysław Dębiak nói anh thi đấu ở nội dung tối ưu thuật toán, trong đó mục tiêu là viết ra giải pháp hiệu quả nhất cho một bài toán phức tạp. Trong cuộc thi này, Przemysław Dębiak phải viết một chương trình hướng dẫn robot di chuyển trên một lưới 30x30 với số bước ít nhất có thể.

Khi nhìn lại cuộc thi, Przemysław Dębiak thừa nhận nhiều yếu tố thuận lợi đã nghiêng về phía anh.

“Có những dạng bài toán khác mà AI sẽ chiến thắng và tất cả lập trình viên là con người đều bị bỏ lại rất xa”, anh nói thêm.

Câu nói thể hiện sự khiêm tốn và thực tế của Przemysław Dębiak. Anh công nhận rằng chiến thắng lần này là do đề thi phù hợp với con người hơn chứ không có nghĩa AI luôn thua. Nếu gặp bài toán hợp với hơn, AI có thể thắng áp đảo, theo Przemysław Dębiak.

Lịch sử AI đánh bại con người

AI từ lâu đã đánh bại con người trong nhiều cuộc thi nổi tiếng. Năm 1997, cỗ máy AI Deep Blue của IBM đã đánh bại đại kiện tướng cờ vua Garry Kasparov. Năm 2016, mô hình AlphaGo của Google DeepMind đã thắng nhà vô địch cờ vây thế giới Lee Sedol.

Vào tháng 2, Sam Altman từng nói rằng đến cuối năm nay, AI của OpenAI có thể vượt qua con người trong các cuộc thi lập trình.

AI hiện đã viết một lượng lớn mã tại Microsoft, Google và Meta Platforms, giám đốc điều hành những công ty này tiết lộ trong những tháng gần đây.

Sam Altman từng nhận định rằng nhu cầu về kỹ sư phần mềm có thể sẽ giảm trong tương lai.

“Trước mắt, nhờ có AI hỗ trợ, mỗi kỹ sư phần mềm sẽ có năng suất cao hơn, làm được nhiều việc hơn. Song về lâu dài, khi AI ngày càng tốt hơn, số lượng kỹ sư phần mềm mà công ty cần có thể giảm đi”, doanh nhân 40 tuổi người Mỹ nói vào tháng 3 khi đề cập đến chiến lược tuyển dụng của OpenAI.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/lap-trinh-vien-danh-bai-mo-hinh-ai-tien-tien-cua-openai-o-giai-vo-dich-the-gioi-loai-nguoi-da-thang-235140.html