Công ty mẹ Claude AI bị kiện

Reddit cáo buộc Anthropic đã truy cập trái phép trang hơn 100.000 lần, dù trước đó khẳng định đã ngừng hành động này.

 Reddit là diễn đàn trực tuyến nơi người dùng có thể chia sẻ suy nghĩ ẩn danh, tương tác với nhau. Ảnh: Reuters.

Reddit là diễn đàn trực tuyến nơi người dùng có thể chia sẻ suy nghĩ ẩn danh, tương tác với nhau. Ảnh: Reuters.

Tại một phiên tòa ở San Francisco ngày 4/6, Reddit cho biết công ty AI Anthropic đã sử dụng dữ liệu của mình cho mục đích thương mại một cách trái phép, không trả phí và cũng không tuân thủ chính sách về dữ liệu người dùng của nền tảng.

Trong đơn kiện, Reddit gọi Anthropic là một "công ty trí tuệ nhân tạo đến sau, tự nhận mình là hiệp sĩ trắng của ngành AI. Nhưng thực tế hoàn toàn không phải vậy". Diễn đàn màu cam cho biết Anthropic truy cập nền tảng của mình hơn 100.000 lần kể từ tháng 7/2024, dù trước đó đã tuyên bố đã chặn các bot không còn thu thập dữ liệu.

“Anthropic thực chất đã cố tình huấn luyện mô hình AI bằng dữ liệu cá nhân của người dùng Reddit mà không hề xin phép họ”, đơn kiện nêu rõ. Hành vi này đi ngược lại với những động thái đóng góp trước đó của công ty với ngành công nghiệp trí tuệ nhân tạo.

Theo các giám đốc điều hành trong ngành AI, dữ liệu từ Reddit đặc biệt hữu ích cho việc huấn luyện mô hình. Nền tảng này lưu trữ hàng loạt tương tác mang tính đối thoại giữa con người với nhau. Hiện có hơn 100.000 subreddit (diễn đàn nhỏ) đang hoạt động.

Trong đơn kiện, Reddit dẫn lại một bài nghiên cứu do Anthropic công bố vào năm 2021. Công ty AI đã nhấn mạnh tính hữu dụng của dữ liệu từ diễn đàn trực tuyến này trong việc huấn luyện các mô hình trí tuệ nhân tạo.

Ben Lee, Giám đốc pháp lý của Reddit, cho biết việc “khai thác thương mại” nội dung từ Reddit có thể mang lại giá trị lên đến hàng tỷ USD. Công ty nói rằng họ đã cố gắng đàm phán với Anthropic nhưng không thành công. “Chúng tôi tin vào một môi trường internet mở. Nhưng điều đó không có nghĩa là thoải mái với việc bị khai thác”, ông Lee nói.

Reddit đã ký hợp đồng với Google vào tháng 2/2024 để cung cấp dữ liệu huấn luyện AI cho công ty này. Theo Bloomberg, diễn đàn cam cũng đã ký hợp đồng với một công ty giấu tên có giá trị khoảng 60 triệu USD mỗi năm.

Cùng năm đó, công ty đã thực hiện một số biện pháp nhằm hạn chế việc thu thập dữ liệu trái phép trên trang web của mình. Họ đưa ra chính sách nội dung công khai dành cho dữ liệu người dùng có thể truy cập công cộng, và cập nhật mã nguồn ở phần back-end. Chính sách dữ liệu này bao gồm các biện pháp bảo vệ người dùng, chẳng hạn như đảm bảo rằng các bài viết và bình luận đã bị xóa sẽ không được đưa vào các thỏa thuận cấp phép dữ liệu.

Đây không phải là lần đầu tiên startup AI được Amazon hậu thuẫn này bị kiện vì cáo buộc vi phạm bản quyền. Tháng 8/2024, 3 tác giả đệ đơn kiện tập thể, cáo buộc Anthropic “xây dựng một doanh nghiệp trị giá hàng tỷ USD bằng cách đánh cắp hàng trăm nghìn cuốn sách có bản quyền.”

Tháng 10/2023, Universal Music cũng kiện công ty tại tòa án liên bang Tennessee vì “vi phạm bản quyền có hệ thống và trên diện rộng đối với lời bài hát”. Vụ việc của nhà phát triển Claude là một phần trong xu hướng ngày càng tăng của các vụ kiện công ty AI.

Gần đây, Anthropic đã ra mắt mô hình AI mới nhất mang tên Claude Opus 4, được cộng đồng AI đón nhận tích cực và đạt điểm cao trong các bài đánh giá chuẩn ngành. Theo nguồn tin của WSJ, người phát ngôn của Anthropic cho biết công ty không đồng tình với các cáo buộc từ Reddit và sẽ bảo vệ mình một cách quyết liệt.

Nhật Tường

Nguồn Znews: https://znews.vn/cong-ty-me-claude-ai-bi-kien-post1558392.html