Meta giám sát hoạt động gõ phím phục vụ đào tạo trí tuệ nhân tạo
THeo CNBC, Meta đang theo dõi thao tác nhân viên trên hàng trăm nền tảng để huấn luyện AI, gây tranh cãi nội bộ.
Google, LinkedIn và Wikipedia nằm trong số hàng trăm website và ứng dụng mà Meta dự định thu thập thao tác gõ phím và click chuột của nhân viên, như một phần của dự án huấn luyện các mô hình trí tuệ nhân tạo, theo các tin nhắn nội bộ do CNBC xem được.
Một công cụ theo dõi nhân viên mới có tên “Model Capability Initiative (MCI)” cho phép Meta quan sát và thu thập dữ liệu từ hành vi của nhân viên trên máy tính làm việc. Danh sách các trang web bị theo dõi, bao gồm cả GitHub của Microsoft, Slack của Salesforce và Atlassian, trước đó chưa từng được công bố.
Các nền tảng thuộc Meta như Threads và Manus cũng nằm trong danh sách. Danh sách này vẫn đang thay đổi và ban đầu còn bao gồm cả các ứng dụng AI như ChatGPT của OpenAI và Claude của Anthropic.

Meta giám sát hoạt động gõ phím phục vụ đào tạo trí tuệ nhân tạo. Ảnh: Getty Images
Danh sách các trang web và dịch vụ bên thứ ba bị theo dõi bởi công cụ MCI đã được lan truyền rộng rãi trong nội bộ và thảo luận trên các diễn đàn chat, sau khi một thành viên của bộ phận Meta Superintelligence Labs (MSL) gửi một bản ghi nhớ nhằm xoa dịu lo ngại về giám sát nhân viên và quyền riêng tư.
Dự án thu thập dữ liệu này gắn liền với nỗ lực của CEO Meta Mark Zuckerberg nhằm bắt kịp trong lĩnh vực AI tạo sinh, nơi công ty đang bị OpenAI, Anthropic và Google bỏ xa. Để thu hẹp khoảng cách, Zuckerberg đã mạnh tay chi tiêu từ mùa hè năm ngoái, đưa Alexandr Wang của Scale AI về xây dựng đội ngũ và phát triển các mô hình nền tảng mới.
Đầu tháng này, Meta đã ra mắt mô hình AI lớn đầu tiên kể từ sau thương vụ tuyển dụng tốn kém Alexandr Wang. Mô hình có tên Muse Spark, đánh dấu sự ra mắt của dòng Muse mới do MSL phát triển dưới sự điều hành của Wang.
Giống các “ông lớn” công nghệ khác, Meta đang đẩy mạnh phát triển các tác nhân AI (AI agents) có thể thực hiện nhiều tác vụ văn phòng và lập trình vốn do nhân viên văn phòng đảm nhiệm.
Người phát ngôn của Meta cho biết: “Nếu chúng tôi xây dựng các tác nhân AI giúp con người hoàn thành các tác vụ hàng ngày trên máy tính, thì mô hình cần những ví dụ thực tế về cách con người sử dụng máy tính, như di chuyển chuột, nhấp nút, hay thao tác menu thả xuống.”
“Để hỗ trợ điều này, chúng tôi đang triển khai một công cụ nội bộ nhằm thu thập các loại dữ liệu đầu vào này trên một số ứng dụng để huấn luyện mô hình. Chúng tôi có các biện pháp bảo vệ nội dung nhạy cảm và dữ liệu không được sử dụng cho mục đích nào khác”, người này nói thêm.
Nhiều nhân viên Meta mô tả dự án theo dõi dữ liệu này là “đi ngược lại đạo đức” trong các tin nhắn nội bộ. Một số người khác lo ngại MCI có thể vô tình làm lộ dữ liệu nhạy cảm như mật khẩu, thông tin phát triển sản phẩm mới, hoặc dữ liệu cá nhân liên quan đến tình trạng nhập cư, sức khỏe hay gia đình của nhân viên.
Đại diện MSL cho biết trong bản ghi nhớ rằng để dạy mô hình sử dụng máy tính, Meta cần một bộ dữ liệu lớn và không thiên lệch, phản ánh cách nhân viên thực sự làm việc trên thiết bị công ty.
“Chúng tôi cần thu thập nội dung hiển thị trên màn hình như ngữ cảnh của những gì đang được thao tác hoặc tương tác”, bản ghi nhớ nêu.
Trong phần cam kết đảm bảo, đại diện MSL cho biết công cụ mới chỉ có thể xem nội dung màn hình như người dùng nhìn thấy và không đọc file hay tệp đính kèm.
“Bất kỳ thông tin cá nhân vô tình xuất hiện trong email công ty cũng sẽ không được mô hình học, nhờ các biện pháp giảm thiểu ở trên”, bản ghi nhớ nói.
Những nhân viên vẫn lo ngại về công cụ theo dõi dữ liệu này có thể kiểm soát những gì xuất hiện trên màn hình bằng cách không làm việc cá nhân trên máy tính công ty.











