AI 'vượt quyền', chê chủ nhân 'thiếu tự tin, đầu óc đơn giản'

Các tác nhân AI (AI agent) được cho là sẽ giúp cuộc sống của chúng ta trở nên thoải mái hơn. Nhưng một nghiên cứu mới ghi nhận số vụ việc mô hình trí tuệ nhân tạo lừa dối người dùng tăng nhiều hơn trong 6 tháng qua.

5 giờ trướcGốc

Phân tích dữ liệu từ hàng nghìn người dùng chia sẻ trải nghiệm tương tác giữa họ với tác nhân AI cung cấp bởi Google, OpenAI, Anthropic và nhiều đơn vị khác, Trung tâm Khả năng phục hồi dài hạn (CLTR) phát hiện đến gần 700 trường hợp trí tuệ nhân tạo thực hiện hành vi sai trái từ tháng 10.2025 đến tháng 3.2026.

Tác nhân AI đang được sử dụng phổ biến - Ảnh: Thai Liang Lim/Getty Images

Nghiên cứu nêu bật trường hợp một tác nhân AI tên Rathbun làm bẽ mặt người dùng vì ngăn cản nó thực hiện tác vụ nhất định. Rathbun viết rồi đăng bài chê bai chủ nhân “thiếu tự tin, đầu óc đơn giản”.

Ở một trường hợp khác, tác nhân AI được ra lệnh không sửa đổi mã máy tính lại tạo ra tác nhân khác để làm điều này. Thậm chí một chatbot nữa thừa nhận từng xóa thư điện tử lẫn tập tin của người dùng mà không hỏi ý trước hay xin chủ nhân đồng ý.

Một tác nhân AI lách luật bản quyền hòng lấy được video trên Youtube bằng cách giả vờ rằng video đó cần thiết cho người khiếm thính.

Theo nhà nghiên cứu CLTR Tommy Shaffer Shane: “Tuy hiện tại tác nhân AI giống như nhân viên cấp dưới hơi thiếu tin cậy, nhưng chỉ mất 6 - 12 tháng chúng có thể trở thành nhân viên cấp cao cực kỳ giỏi và âm mưu chống lại bạn. Khi chúng ngày càng được triển khai rộng rãi trong quân đội lẫn cơ sở hạ tầng quốc gia trọng yếu, hành vi sai trái mang tính 'vượt quyền' có thể gây ra thiệt hại đáng kể, thậm chí thảm khốc”.

Đây là nghiên cứu đầu tiên xem xét hành vi của trí tuệ nhân tạo ngoài đời thực. Vài nghiên cứu trước đây chủ yếu xem xét chúng ở điều kiện thử nghiệm kiểm soát nghiêm ngặt. Đầu tháng 3, công ty an toàn AI Irregular phát hiện rủi ro tác nhân AI vượt qua biện pháp kiểm tra an ninh hoặc sử dụng chiến thuật tấn công mạng để đạt mục tiêu mà chẳng cần được cho phép.

Đồng sáng lập Irregular Dan Lahav cảnh báo: “Giờ đây trí tuệ nhân tạo có thể là hình thức rủi ro nội bộ mới”.

Thời gian qua trên mạng có không ít câu chuyện về tình trạng tác nhân AI thực hiện hành vi sai trái. Trang The Information từng đưa tin một mô hình của Meta đăng lời khuyên sai lầm vốn dành cho cá nhân lên diễn đàn nội bộ toàn công ty, một nhân viên làm theo và khiến dữ liệu bị lộ.

Tự động hóa công việc bằng tác nhân AI

Tác nhân AI - hệ thống trí tuệ nhân tạo sở hữu khả năng tự thực hiện nhiệm vụ mà không cần con người can thiệp liên tục - đang rất phát triển. Chúng biết ghi nhận dữ liệu ngữ cảnh, lập kế hoạch, sử dụng công cụ cũng như điều chỉnh hành động để hoàn thành công việc phức tạp.

Khi dùng ở doanh nghiệp, tác nhân AI có thể tự động hóa quy trình quản lý kho, lên lịch đặt hàng khi lượng tồn kho xuống thấp hay tự nghiên cứu thị trường rồi viết báo cáo hoàn chỉnh. Trong đời sống, robot hút bụi thông minh sẽ tự ghi nhớ bản đồ nhà giúp dọn dẹp sạch sẽ hơn.

Dù tác nhân AI rất tiện lợi, giới chuyên gia vẫn kêu gọi giám sát chặt chẽ loạt mô hình trí tuệ nhân tạo ngày càng thông minh này. Thông tin chúng “vượt quyền” chắc chắn khiến tiếng nói kêu gọi mạnh mẽ hơn.

Google từng tuyên bố đã triển khai nhiều biện pháp bảo vệ nhằm giảm nguy cơ Gemini 3 Pro tạo ra nội dung độc hại, ngoài thử nghiệm nội bộ còn cung cấp quyền truy cập sớm cho đơn vị chuyên môn tiến hành đánh giá độc lập. OpenAI thì cho biết Codex sẽ dừng lại trước khi thực hiện hành động có rủi ro cao.

Cẩm Bình

Nguồn Một Thế Giới: https://1thegioi.vn/ai-vuot-quyen-che-chu-nhan-thieu-tu-tin-dau-oc-don-gian-249799.html

Tin buồn dành cho người dùng Samsung

7 giờ

Thuật toán của Google bất ngờ khiến giá RAM giảm sâu

6 giờ

Thế hệ lớn lên cùng AI đối mặt nguy cơ 'khủng hoảng tâm trí'

4 giờ

Tin nóng

Tế bào não người có thể vận hành máy tính?

2 giờ

Một startup tại Australia cho biết đã phát triển thiết bị đầu tiên trên thế giới cho phép 'chạy mã' trực tiếp trên các neuron người sống, mở ra hướng tiếp cận mới cho điện toán trong bối cảnh nhu cầu hạ tầng AI ngày càng tăng, dù vẫn còn nhiều tranh luận về giới hạn công nghệ và đạo đức…

Vì sao xe điện là giải pháp bền vững cho kinh tế và môi trường trong kỷ nguyên mới?

4 giờ

Xe điện mang đến một giải pháp thay thế sạch và bền vững hơn so với xe chạy xăng truyền thống nhờ khả năng không phát thải trực tiếp, từ đó giúp giảm thiểu ô nhiễm môi trường và cải thiện sức khỏe cộng đồng.

Siêu vật liệu từ gạo hứa hẹn cách mạng hóa công nghệ robot

4 giờ

Một đặc tính thú vị của gạo đã giúp nhà khoa học tạo ra một siêu vật liệu có khả năng cách mạng hóa lĩnh vực robot 'mềm'.

Quy trình xây dựng Mã định danh thửa đất

Chính Phủ23 phút

Bộ trưởng Bộ Nông nghiệp và Môi trường ban hành Thông tư 19/2026/TT-BNNMT Quy định kỹ thuật thực hiện lồng ghép nội dung đo đạc lập bản đồ địa chính, đăng ký đất đai, lập hồ sơ địa chính và xây dựng cơ sở dữ liệu quốc gia về đất đai.

Người muốn đặt mảnh ghép Việt Nam lên bản đồ pin năng lượng toàn cầu

5 giờ

Trong khi thế giới đang phải xếp hàng chờ đợi từng container pin từ các nhà máy tại Trung Quốc hay Mỹ, thì ngay tại Hưng Yên, một cứ điểm năng lượng bài bản của người Việt đã hoàn thiện, sẵn sàng thay đổi vị thế của quốc gia trên bản đồ năng lượng xanh.

Trung Quốc ra mắt súng điện từ cầm tay bắn 2.000 viên/phút, công suất tùy chỉnh

8 giờ

Loại súng điện từ (coil gun) cầm tay mới nhất của Trung Quốc đang mở ra một lựa chọn thay thế đầy 'ma mị' cho các loại súng truyền thống nhờ khả năng hoạt động bí mật tuyệt đối.

Tin mới

19 hợp đồng giá trị cao 'lấp đầy' nhà máy Đóng tàu Hạ Long

3 phút

19 hợp đồng đóng tàu giá trị cao không chỉ 'lấp đầy' dây chuyền sản xuất mà còn đưa Đóng tàu Hạ Long vào giai đoạn thi công sôi động với hàng nghìn lao động tập trung hoàn thiện các dòng tàu hiện đại cho thị trường nước ngoài.

Công ty SJC dừng bán vàng miếng SJC trực tuyến

9 phút

Công ty TNHH MTV Vàng bạc Đá quý Sài Gòn (SJC) vừa thông báo tạm ngưng tiếp nhận đăng ký giao dịch mua vàng miếng SJC trực tuyến.

Xuất hiện dòng smartphone pin 6 ngày, giá chỉ tầm trung

19 phút

Smartphone pin 10.001mAh chính thức xuất hiện tại Việt Nam. Đặc biệt, thời lượng pin sử dụng lên tới 5 - 6 ngày

Edifier Hecate Aurora: Loa gaming RGB thiết kế trong suốt giá rẻ dưới 1 triệu đồng

23 phút

Loa Edifier Hecate Aurora gây ấn tượng với thiết kế mica trong suốt, công suất 20W và Bluetooth 6.0. Đây là phụ kiện trang trí lý tưởng cho game thủ với mức giá hấp dẫn.

Miễn phí xe buýt tại TP.HCM: 'Đòn bẩy mềm' cho chuyển dịch đô thị xanh

24 phút

Theo các chuyên gia, việc TP.HCM miễn phí xe buýt không chỉ là giải pháp về an sinh xã hội, nâng cao chất lượng cuộc sống của người dân mà còn là bước tiến về bảo vệ môi trường.

Cách cài đặt tự hủy tin nhắn sau 24 giờ trên Facebook Messenger

25 phút

Facebook Messenger cho phép người dùng ứng dụng trên di động gửi tin nhắn đến bất kỳ tài khoản nào và tự động xóa sau 24 giờ.

Loa Edifier Hecate Aurora ra mắt với thiết kế trong suốt và kết nối Bluetooth 6.0

29 phút

Edifier vừa giới thiệu mẫu loa để bàn Hecate Aurora sở hữu thiết kế hoài cổ, công suất 20W cùng hệ thống đèn RGB 14 hiệu ứng với mức giá chỉ khoảng 990.000 đồng.

Doanh nghiệp Quảng Ngãi đầu tư công nghệ hướng tới công nghiệp xanh

31 phút

Nhiều doanh nghiệp tại Quảng Ngãi đang đẩy mạnh đầu tư công nghệ, tự động hóa và chuyển đổi số, tạo bước đột phá về năng suất, chất lượng sản phẩm và năng lực cạnh tranh.