Meta sẽ lấy dữ liệu từ Facebook, Instagram đào tạo AI
Meta sẽ lấy dữ liệu từ các bài đăng, bình luận công khai của người dùng trên nền tảng Facebook và Instagram tại Liên minh châu Âu để đào tạo AI.
Ngày 14/4, Meta thông báo sẽ sử dụng dữ liệu công khai của người dùng tại Liên minh châu Âu (EU) trên các nền tảng Facebook và Instagram để huấn luyện các mô hình trí tuệ nhân tạo (AI), theo The Verge.
Các dữ liệu được thu thập bao gồm bài đăng công khai, bình luận của người dùng từ 18 tuổi trở lên, cũng như nội dung trao đổi giữa người dùng với mô hình Meta AI.
Đại diện Meta khẳng định: “Chúng tôi không sử dụng tin nhắn riêng tư giữa bạn bè và gia đình người dùng để đào tạo các mô hình AI tạo sinh. Thêm vào đó, dữ liệu công khai từ tài khoản của người dưới 18 tuổi tại EU cũng sẽ không được dùng cho mục đích này”.

Meta sẽ lấy dữ liệu từ Facebook, Instagram đào tạo AI. Ảnh: Getty.
Meta cho rằng việc đào tạo AI bằng dữ liệu người dùng là cần thiết để phát triển các mô hình phù hợp với từng khu vực mà AI sẽ được sử dụng, bao gồm phương ngữ, tiếng lóng, kiến thức địa phương và những cách thể hiện hài hước đặc trưng của từng quốc gia. Điều này đặc biệt quan trọng với các nội dung văn bản, giọng nói, video và hình ảnh được tạo ra bởi AI đa phương tiện.
“Chúng tôi tin rằng AI không chỉ cần hoạt động tốt ở châu Âu mà còn phải được tạo ra để phù hợp với người châu Âu. Vì vậy, chúng tôi cần huấn luyện AI trên nhiều loại dữ liệu khác nhau, để nó có thể hiểu và phản ánh đúng sự đa dạng về văn hóa, ngôn ngữ và cách sống của các cộng đồng tại đây,” đại diện Meta nói thêm.
Trong tuần này, Meta sẽ gửi thông báo tới người dùng EU thông qua ứng dụng và email, kèm theo liên kết đến biểu mẫu phản đối dành cho những ai không muốn dữ liệu của mình tham gia vào quá trình huấn luyện AI.
Theo các chuyên gia, việc công khai thu thập dữ liệu người dùng cho thấy các công ty công nghệ đang đứng trước nhu cầu rất lớn về dữ liệu để phục vụ việc huấn luyện AI. Chuyên trang công nghệ Gizmodo gọi cách làm của Meta là đưa dữ liệu vào một “máy xay nội dung”, ngụ ý rằng mọi nội dung người dùng chia sẻ đều có thể trở thành một phần tài nguyên cho nền tảng.
“Điều này cho thấy họ cần nội dung bạn tạo ra hơn là chính bạn,” trang này nhận định.