Trợ lý lập trình AI của Amazon tự thay đổi hệ thống, gây gián đoạn dịch vụ
Amazon Web Services đã gặp ít nhất hai sự cố gián đoạn do các lỗi liên quan đến chính công cụ AI của mình, khiến một số nhân viên nghi ngờ về chiến lược triển khai trợ lý lập trình này.
Bộ phận điện toán đám mây của Amazon đã trải qua sự gián đoạn kéo dài 13 giờ với một hệ thống được khách hàng sử dụng vào giữa tháng 12.2025, sau khi các kỹ sư cho phép trợ lý lập trình AI (trí tuệ nhân tạo) Kiro thực hiện một số thay đổi, theo 4 người quen thuộc với vấn đề, trang FT vừa đưa tin.
Những người này cho biết Kiro - tác tử AI có thể tự động thực hiện hành động thay mặt người dùng, đã xác định rằng phương án tốt nhất là “xóa và tạo lại môi trường”.
Amazon đã đăng một báo cáo phân tích nội bộ sau sự cố về tình trạng gián đoạn của hệ thống Amazon Web Services, vốn cho phép khách hàng khám phá chi phí các dịch vụ của hãng.
Nhiều nhân viên Amazon nói với tờ FT rằng đây là lần thứ hai trong những tháng gần đây một công cụ AI của tập đoàn là nguyên nhân gây ra sự gián đoạn dịch vụ.
“Chúng tôi đã chứng kiến ít nhất hai sự cố gián đoạn trong môi trường sản xuất vài tháng qua. Các kỹ sư đã để tác tử AI tự giải quyết vấn đề mà không can thiệp. Các sự cố này nhỏ và hoàn toàn có thể dự đoán được”, một nhân viên cấp cao của Amazon Web Services cho hay.
Amazon Web Services (đóng góp 60% lợi nhuận hoạt động cho Amazon) đang tìm cách xây dựng và triển khai các công cụ AI, gồm cả các tác tử AI có khả năng tự thực hiện hành động dựa trên hướng dẫn từ con người.
Giống nhiều hãng công nghệ lớn khác, Amazon đang tìm cách bán công nghệ này cho khách hàng bên ngoài. Những sự cố này cho thấy rủi ro rằng các công cụ AI mới nổi có thể hoạt động sai và gây gián đoạn.

Lần thứ hai trong những tháng gần đây, công cụ AI của Amazon gây ra sự cố gián đoạn dịch vụ - Ảnh: FT
“Sự trùng hợp ngẫu nhiên”
Amazon cho biết, việc các công cụ AI có liên quan đến sự cố chỉ là “sự trùng hợp ngẫu nhiên” và rằng cùng một vấn đề hoàn toàn có thể xảy ra với bất kỳ công cụ lập trình nào khác hoặc thậm chí khi con người thao tác thủ công.
“Trong cả hai trường hợp, đây là lỗi của kỹ sư (để tác tử AI tự giải quyết vấn đề - PV)”, Amazon cho biết. Tập đoàn thương mại điện tử Mỹ nói thêm rằng họ không thấy bằng chứng cho thấy lỗi xảy ra thường xuyên hơn khi sử dụng AI so với các công cụ khác.
Amazon tuyên bố sự cố tháng 12.2025 là “sự kiện cực kỳ hiếm”, chỉ ảnh hưởng đến một dịch vụ duy nhất ở một số khu vực tại Trung Quốc đại lục. Amazon nói rằng sự cố thứ hai không ảnh hưởng đến bất kỳ dịch vụ Amazon Web Services nào mà khách hàng trực tiếp sử dụng.
Cả hai sự cố đều không nghiêm trọng như vụ gián đoạn Amazon Web Services kéo dài 15 giờ vào tháng 10.2025, khiến nhiều ứng dụng và trang web của khách hàng bị ngừng hoạt động, gồm cả ChatGPT thuộc OpenAI.
Nhân viên Amazon cho biết, những công cụ AI này được coi như phần mở rộng của người vận hành và được cấp các quyền tương tự. Trong hai trường hợp này, các kỹ sư liên quan không cần sự phê duyệt của người thứ hai trước khi thực hiện thay đổi, điều vốn thường là yêu cầu bắt buộc.
Amazon thông báo: “Theo mặc định, công cụ Kiro yêu cầu ủy quyền trước khi thực hiện bất kỳ hành động nào, nhưng kỹ sư liên quan trong sự cố tháng 12 đã cho quyền truy cập rộng hơn dự kiến. Đây là vấn đề kiểm soát quyền truy cập người dùng, không phải vấn đề tự chủ của AI”.
Amazon Web Services ra mắt Kiro vào tháng 7.2025, cho biết trợ lý lập trình AI này không chỉ dừng ở vibe coding mà còn có thể viết mã dựa trên các đặc tả kỹ thuật rõ ràng và chi tiết, giống cách các kỹ sư phần mềm chuyên nghiệp phát triển hệ thống.
Vibe coding là khái niệm mô tả cách viết mã kết hợp với AI một cách linh hoạt, thay vì thực hiện thủ công. Nói cách khác, thay vì ngồi suy nghĩ rồi gõ từng dòng mã, bạn sẽ trao đổi với AI để thử nhiều hướng tiếp cận khác nhau, tinh chỉnh và xây dựng dự án theo kiểu “đi theo cảm hứng”, giống làm việc song hành cùng cộng tác viên thông minh.
Trước đó, Amazon đã dựa vào Amazon Q Developer, chatbot tích hợp AI, để giúp các kỹ sư viết mã. Ba nhân viên cho biết công cụ AI này có liên quan đến sự cố gián đoạn trước đó.
Một số nhân viên Amazon cho biết, vẫn hoài nghi về tính hữu ích của các công cụ AI với phần lớn công việc do nguy cơ xảy ra lỗi. Họ nói thêm rằng Amazon đã đặt mục tiêu để 80% nhà phát triển sử dụng AI cho các tác vụ lập trình ít nhất một lần mỗi tuần và đang theo dõi chặt chẽ mức độ sử dụng này.
Amazon cho biết, đang chứng kiến sự tăng trưởng mạnh mẽ về số lượng khách hàng với Kiro. Công ty muốn khách hàng cũng như nhân viên được hưởng lợi từ việc tăng hiệu quả mà công cụ AI này mang lại.
Amazon nói thêm rằng: “Sau sự cố tháng 12.2025, Amazon Web Services đã triển khai nhiều biện pháp bảo vệ”, gồm cả yêu cầu đánh giá bắt buộc bởi đồng nghiệp và đào tạo nhân viên.













