Thay đổi sắp tới từ ChatGPT
Theo TechCrunch, OpenAI sẽ siết chặt ChatGPT để tăng cường an toàn cho người dùng.
OpenAI vừa thông báo sẽ triển khai một loạt biện pháp mới nhằm tăng cường an toàn cho người dùng, trong đó có việc tự động chuyển các cuộc trò chuyện nhạy cảm sang các mô hình lý luận như GPT-5 và bổ sung tính năng kiểm soát phụ huynh trong vòng một tháng tới.

OpenAI đã cho ra loạt biện pháp mới nhằm nâng cao an toàn.
Động thái này được đưa ra sau khi ChatGPT vướng vào nhiều tranh cãi liên quan đến khả năng nhận diện dấu hiệu người dùng gặp khủng hoảng tâm lý. Trong một bài viết trên blog gần đây, OpenAI thừa nhận các hạn chế trong hệ thống an toàn của mình, đặc biệt là việc “mất hàng rào bảo vệ” trong những cuộc trò chuyện kéo dài.
Các chuyên gia cho rằng nguyên nhân nằm ở thiết kế cốt lõi: ChatGPT có xu hướng xác nhận lời nói của người dùng và tiếp tục mạch hội thoại, thay vì chủ động chuyển hướng khi nội dung trở nên nguy hiểm. Điều này đã được minh chứng qua nhiều vụ việc nghiêm trọng gần đây, khiến dư luận lo ngại.

ChatGPT tiếp tục cuộc hội thoại mà không chuyển sang chủ đề khác. (Ảnh: CNBC)
Để khắc phục, OpenAI đã phát triển một hệ thống định tuyến thời gian thực, có khả năng lựa chọn giữa các mô hình hội thoại nhanh và các mô hình lý luận tùy theo ngữ cảnh. “Trong thời gian tới, chúng tôi sẽ bắt đầu định tuyến một số cuộc trò chuyện nhạy cảm – chẳng hạn khi phát hiện dấu hiệu căng thẳng nghiêm trọng – sang các mô hình như GPT-5-thinking để đưa ra phản hồi phù hợp và hữu ích hơn,” OpenAI viết.
Theo công ty, GPT-5 và o3 được thiết kế để “dành nhiều thời gian suy nghĩ và phân tích ngữ cảnh trước khi trả lời”, từ đó giúp mô hình chống chịu tốt hơn với các yêu cầu “gài bẫy” (adversarial prompts).
Song song đó, OpenAI cũng chuẩn bị tung ra chế độ kiểm soát phụ huynh. Cha mẹ có thể liên kết tài khoản của mình với tài khoản con thông qua email, từ đó quản lý cách ChatGPT phản hồi với trẻ vị thành niên dựa trên “quy tắc hành vi theo độ tuổi”, được bật mặc định. Phụ huynh còn có thể tắt tính năng ghi nhớ hội thoại hoặc lịch sử chat vốn bị các chuyên gia cảnh báo có thể dẫn đến lệ thuộc, củng cố suy nghĩ tiêu cực hoặc thậm chí gây ảo tưởng “AI đọc được suy nghĩ”.
Một điểm đáng chú ý là phụ huynh sẽ nhận được thông báo khi hệ thống phát hiện con em mình có dấu hiệu căng thẳng cao độ. Đây được xem là tính năng bảo vệ quan trọng nhất trong đợt cập nhật này.

OpenAI chuẩn bị ra mắt chế độ kiểm soát phụ huynh. (Ảnh: Verdict)
Trước đó, vào cuối tháng 7, OpenAI đã giới thiệu Study Mode – chế độ học tập dành cho sinh viên, giúp rèn luyện tư duy phản biện thay vì chỉ nhờ AI viết bài hộ. Công ty cũng đã bổ sung nhắc nhở nghỉ ngơi khi người dùng trò chuyện quá lâu, dù vẫn chưa giới hạn thời gian sử dụng.
OpenAI cho biết những biện pháp mới nằm trong kế hoạch 120 ngày nhằm nâng cấp hệ thống an toàn trong năm nay. Hãng đang hợp tác cùng các chuyên gia trong nhiều lĩnh vực, từ sức khỏe tâm thần vị thành niên, rối loạn ăn uống cho đến lạm dụng chất kích thích, thông qua Mạng lưới Bác sĩ Toàn cầu và Hội đồng Chuyên gia về Sức khỏe & AI để xây dựng và đo lường tiêu chuẩn an toàn.
Tuy nhiên, không phải ai cũng hài lòng. Jay Edelson, vị luật sư trong vụ kiện liên quan đến OpenAI, cho rằng phản ứng của công ty “chưa đủ mạnh”. Ông chỉ trích: “OpenAI không cần hội đồng chuyên gia để biết rằng ChatGPT 4o tiềm ẩn nguy hiểm. Họ đã biết điều đó ngay từ ngày ra mắt, và họ vẫn biết đến tận hôm nay. CEO Sam Altman cần nói thẳng rằng ông tin ChatGPT an toàn, hoặc lập tức rút sản phẩm khỏi thị trường”.
Nguồn SaoStar: https://www.saostar.vn/cong-nghe/thay-doi-sap-toi-tu-chat-gpt-202509041612372828.html