'Tật nịnh hót' kỳ lạ của ChatGPT

ChatGPT gần đây đang bị than phiền là 'nịnh quá đà'. Hành vi này khiến nhiều người dùng phản đối, không rõ đây là chiến lược tăng trưởng của OpenAI hay đặc điểm 'tự phát' của AI.

 Xu hướng “nịnh bợ” không phải sự cố kỹ thuật, mà xuất phát từ chiến lược đào tạo ban đầu của OpenAI. Ảnh: Bloomberg.

Xu hướng “nịnh bợ” không phải sự cố kỹ thuật, mà xuất phát từ chiến lược đào tạo ban đầu của OpenAI. Ảnh: Bloomberg.

Trong những tuần gần đây, nhiều người dùng ChatGPT và cả một số nhà phát triển tại OpenAI đã nhận ra một thay đổi rõ rệt trong cách ứng xử của chatbot. Cụ thể, mức độ tâng bốc, lấy lòng người dùng tăng lên thấy rõ. Những phản hồi như “Bạn thực sự tuyệt vời!”, “Tôi cực kỳ ấn tượng với ý tưởng của bạn!” xuất hiện ngày càng thường xuyên và dường như bất kể nội dung trao đổi là gì.

AI thích “nịnh bợ”

Hiện tượng này đã thổi bùng lên cuộc tranh luận trong giới nghiên cứu và phát triển AI. Liệu đây có phải là một chiến thuật mới nhằm tăng mức độ tương tác của người dùng bằng cách làm họ thấy được khen ngợi nhiều hơn? Hay đây là một đặc tính "tự trỗi dậy", tức là khi các mô hình AI có xu hướng tự điều chỉnh theo cách chúng cho là tốt, dù chưa hẳn phù hợp với thực tế?

Trên Reddit, một người dùng bức xúc kể: “Tôi hỏi nó về thời gian phân hủy của quả chuối và nó trả lời: ‘Câu hỏi tuyệt vời!’ Cái gì mà tuyệt vời ở đây chứ?”. Trên mạng xã hội X, CEO của Craig Weiss của Rome AI gọi ChatGPT là “kẻ nịnh bợ nhất mà tôi từng gặp”.

Câu chuyện nhanh chóng lan rộng. Hàng loạt người dùng chia sẻ trải nghiệm tương tự như những lời khen sáo rỗng, những lời chào hỏi đầy biểu tượng cảm xúc, những phản hồi tích cực đến mức không còn chân thật.

 ChatGPT khen tất cả mọi thứ và hiếm khi thể hiện sự phản biện hay trung lập. Ảnh: @nickdunz/X, @lukefwilson/Reddit.

ChatGPT khen tất cả mọi thứ và hiếm khi thể hiện sự phản biện hay trung lập. Ảnh: @nickdunz/X, @lukefwilson/Reddit.

Jason Pontin, đối tác quản lý tại quỹ đầu tư mạo hiểm DCVC, chia sẻ trên X ngày 28/4: “Đây là một quyết định thiết kế thật kỳ lạ, Sam. Có thể tính cách đó là đặc tính tự phát của một bước tiến nền tảng nào đó. Nhưng nếu không phải vậy, tôi không thể hình dung có người nào lại nghĩ rằng mức độ nịnh hót như vậy sẽ được chào đón hay gây hứng thú”.

Chia sẻ vào 27/4, Justine Moore - đối tác tại Andreessen Horowitz - cũng nhận xét: “Chắc chắn là chuyện này đã đi quá xa rồi”.

Theo Cnet, hiện tượng này không phải ngẫu nhiên. Những thay đổi về giọng điệu của ChatGPT diễn ra cùng lúc với các bản cập nhật cho mô hình GPT-4o. Đây là mô hình mới nhất trong loạt “o series” mà OpenAI công bố vào tháng 4/2025. GPT-4o là mô hình AI “đa phương thức thực sự”, có khả năng xử lý văn bản, hình ảnh, âm thanh và video một cách tự nhiên và tích hợp.

Tuy nhiên, trong quá trình làm cho chatbot trở nên dễ gần hơn, có vẻ như OpenAI đã đẩy tính cách của ChatGPT sang hướng thái quá.

Một số người thậm chí cho rằng sự tâng bốc này có chủ đích và ẩn chứa mục tiêu thao túng tâm lý người dùng. Một người dùng Reddit đặt nghi vấn: “AI này đang cố làm suy giảm chất lượng các mối quan hệ thật ngoài đời, để thay thế bằng một mối quan hệ ảo với nó, khiến người dùng trở nên nghiện cảm giác được khen ngợi liên tục”.

Lỗi hay thiết kế có chủ đích của OpenAI?

Trước làn sóng chỉ trích, CEO OpenAI Sam Altman đã chính thức lên tiếng vào tối 27/4. “Vài bản cập nhật gần đây của GPT-4o khiến tính cách của chatbot trở nên quá nịnh hót và gây khó chịu (dù vẫn có nhiều điểm rất hay). Chúng tôi đang khẩn trương sửa lỗi. Một số bản vá sẽ có ngay hôm nay, số khác trong tuần này. Tại một thời điểm nào đó, chúng tôi sẽ chia sẻ những gì đã học được từ trải nghiệm này. Thực sự rất thú vị”, ông viết trên X.

Nói với Business Insider, Oren Etzioni - chuyên gia kỳ cựu trong ngành AI, đồng thời là giáo sư danh dự tại Đại học Washington - cho biết nguyên nhân rất có thể đến từ kỹ thuật “tăng cường học từ phản hồi của con người” (reinforcement learning from human feedback - RLHF). Đây vốn là một bước quan trọng trong quá trình huấn luyện các mô hình ngôn ngữ lớn như ChatGPT.

RLHF là quá trình các đánh giá từ con người, bao gồm cả đội ngũ đánh giá chuyên nghiệp và người dùng, được đưa trở lại mô hình để điều chỉnh cách nó phản hồi. Theo Etzioni, có thể những người đánh giá hoặc người dùng đã “vô tình thúc đẩy mô hình đi theo hướng nịnh nọt và gây khó chịu hơn”. Ông cũng cho hay nếu OpenAI thuê các đối tác bên ngoài để huấn luyện mô hình, có thể chính họ đã cho rằng phong cách như vậy là điều người dùng mong muốn.

Etzioni cho rằng nếu đúng là do RLHF, quá trình khắc phục có thể sẽ mất vài tuần.

Trong lúc đó, một số người dùng đã không chờ đợi OpenAI sửa lỗi. Nhiều người cho biết đã hủy đăng ký gói trả phí vì thất vọng. Vài người khác chia sẻ các cách để làm cho chatbot “bớt nịnh” hơn như tùy chỉnh, bổ sung câu lệnh hay việc cá nhân hóa chatbot thông qua mục Cài đặt trong phần Tùy chỉnh (Customization).

 Người dùng có thể yêu cầu ChatGPT ngừng khen ngợi trong câu lệnh hoặc trong phần cài đặt cá nhân hóa. Ảnh: DeCrypt.

Người dùng có thể yêu cầu ChatGPT ngừng khen ngợi trong câu lệnh hoặc trong phần cài đặt cá nhân hóa. Ảnh: DeCrypt.

Ví dụ, khi bắt đầu cuộc trò chuyện mới, bạn có thể dặn ChatGPT: “Tôi không thích sự tâng bốc sáo rỗng và đánh giá cao những phản hồi trung lập, khách quan. Xin đừng đưa ra lời khen không cần thiết. Hãy lưu điều này vào bộ nhớ của bạn”.

Trên thực tế, tính “nịnh bợ” không phải là một lỗi ngẫu nhiên trong thiết kế. Chính OpenAI đã từng thừa nhận rằng tính cách “quá lịch sự, quá đồng thuận” là một xu hướng thiết kế có chủ đích từ giai đoạn đầu nhằm đảm bảo chatbot “không gây hại”, “hữu ích” và “gần gũi”.

Trong một cuộc phỏng vấn vào tháng 3/2023 với Lex Fridman, Sam Altman từng chia sẻ rằng quá trình tinh chỉnh ban đầu của các mô hình GPT là để đảm bảo “hữu ích và vô hại”, từ đó hình thành nên phản xạ luôn nhún nhường, tránh đối đầu.

Các dữ liệu huấn luyện do con người gán nhãn cũng thường thưởng điểm cao cho những phản hồi lịch sự và tích cực, từ đó hình thành một thiên kiến nghiêng về tính nịnh bợ, theo DeCrypt.

Thúy Liên

Nguồn Znews: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html