Phải trả cho các tác giả 1,5 tỷ đô la vì dùng sách lậu đào tạo chatbot AI

Công ty trí tuệ nhân tạo Anthropic vừa đồng ý trả 1,5 tỷ đô la để giải quyết vụ kiện tập thể của các tác giả sách, những người cho rằng công ty đã lấy các bản sao lậu tác phẩm của họ để đào tạo chatbot.

 Tiểu thuyết kinh dị đầu tay "The Lost Night" của Andrea Bartz, nguyên đơn chính trong vụ án, nằm trong số những tác phẩm được tìm thấy trong tập dữ liệu.

Tiểu thuyết kinh dị đầu tay "The Lost Night" của Andrea Bartz, nguyên đơn chính trong vụ án, nằm trong số những tác phẩm được tìm thấy trong tập dữ liệu.

Nếu được thẩm phán chấp thuận, thỏa thuận giải quyết này có thể đánh dấu bước ngoặt trong các cuộc chiến pháp lý giữa các công ty AI và các nhà văn, nghệ sĩ thị giác và các chuyên gia sáng tạo khác cáo buộc họ vi phạm bản quyền.

Công ty đã đồng ý trả cho tác giả hoặc nhà xuất bản khoảng 3.000 đô la cho mỗi cuốn sách trong số khoảng 500.000 cuốn sách được giải quyết theo thỏa thuận này.

"Theo những gì chúng tôi biết, đây là vụ thu hồi bản quyền lớn nhất từ trước đến nay", Justin Nelson, luật sư của các tác giả, cho biết. "Đây là vụ đầu tiên thuộc loại này trong kỷ nguyên AI".

Tác giả - tiểu thuyết gia kinh dị Andrea Bartz và các nhà văn phi hư cấu Charles Graeber và Kirk Wallace Johnson của Mỹ - đã kiện vào năm ngoái và hiện đại diện cho một nhóm lớn hơn các nhà văn và nhà xuất bản có sách được Anthropic tải xuống để đào tạo chatbot Claude.

Một thẩm phán Liên bang đã đưa ra phán quyết hỗn hợp vào tháng 6, nhận định rằng việc đào tạo chatbot AI về sách có bản quyền không phải là bất hợp pháp nhưng Anthropic đã mua sai hàng triệu cuốn sách thông qua các trang web vi phạm bản quyền. Các chuyên gia cho biết nếu Anthropic không giải quyết, việc thua kiện sau phiên tòa dự kiến diễn ra vào tháng 12 có thể khiến công ty có trụ sở tại San Francisco này phải trả giá đắt hơn nữa.

Thomas Long, một nhà phân tích pháp lý của Wolters Kluwer, cho biết: "Chúng tôi đang xem xét khả năng cao là phải bồi thường hàng tỷ đô la, đủ để làm tê liệt hoặc thậm chí khiến Anthropic phá sản".

Thẩm phán liên bang William Alsup tại San Francisco đã lên lịch phiên điều trần vào ngày 8/9 để xem xét các điều khoản giải quyết.

Anthropic cho biết trong một tuyên bố vào ngày 5/9 rằng nếu thỏa thuận được chấp thuận, "sẽ giải quyết các khiếu nại di sản còn lại của nguyên đơn".

Theo một phần của thỏa thuận, công ty cũng đã đồng ý hủy các tập tin sách gốc mà họ đã tải xuống.

Sách được biết đến là nguồn dữ liệu quan trọng - về bản chất là hàng tỷ từ được xâu chuỗi cẩn thận với nhau - cần thiết để xây dựng các mô hình ngôn ngữ AI lớn đằng sau các chatbot như Claude của Anthropic và đối thủ chính của nó, ChatGPT của OpenAI.

Phán quyết của Alsup vào tháng 6/2025 cho thấy Anthropic đã tải xuống hơn 7 triệu cuốn sách số hóa mà họ "biết là đã bị sao chép lậu". Vụ việc bắt đầu với gần 200.000 cuốn sách từ một thư viện trực tuyến có tên Books3, do các nhà nghiên cứu AI bên ngoài OpenAI tập hợp để phù hợp với bộ sưu tập khổng lồ mà ChatGPT được đào tạo.

Tiểu thuyết kinh dị đầu tay "The Lost Night" của Bartz, nguyên đơn chính trong vụ án, nằm trong số những tác phẩm được tìm thấy trong tập dữ liệu.

Tiểu thuyết kinh dị đầu tay "The Lost Night" của Bartz, nguyên đơn chính trong vụ án, nằm trong số những tác phẩm được tìm thấy trong tập dữ liệu.

Tiểu thuyết kinh dị đầu tay "The Lost Night" của Bartz, nguyên đơn chính trong vụ án, nằm trong số những tác phẩm được tìm thấy trong tập dữ liệu.

Alsup viết rằng Anthropic sau đó đã lấy ít nhất 5 triệu bản từ trang web lậu Library Genesis hay LibGen và ít nhất 2 triệu bản từ Pirate Library Mirror.

Tháng trước, Hội Tác giả đã thông báo với hàng ngàn thành viên rằng họ dự kiến "mức bồi thường tối thiểu sẽ là 750 đô la cho mỗi tác phẩm và có thể cao hơn nhiều" nếu Anthropic bị kết luận là cố ý vi phạm bản quyền tại phiên tòa. Mức bồi thường cao hơn trong thỏa thuận dàn xếp - khoảng 3.000 đô la cho mỗi tác phẩm - có thể phản ánh số lượng sách bị ảnh hưởng ít hơn, sau khi đã loại trừ các bản sao và những tác phẩm không có bản quyền.

Mary Rasenberger, Giám đốc điều hành của Hiệp hội tác giả, đã gọi thỏa thuận này là "một kết quả tuyệt vời cho các tác giả, nhà xuất bản và chủ sở hữu bản quyền nói chung, gửi một thông điệp mạnh mẽ tới ngành công nghiệp AI rằng sẽ có những hậu quả nghiêm trọng khi họ sao chép tác phẩm của tác giả để đào tạo AI của họ, cướp đi những người ít có khả năng chi trả nhất."

Liên minh Quyền Đan Mạch, tổ chức đã đấu tranh thành công để đóng cửa một trong những thư viện ngầm này, cho biết rằng thỏa thuận này sẽ không giúp ích nhiều cho các nhà văn và nhà xuất bản châu Âu có tác phẩm không được đăng ký với Văn phòng Bản quyền Hoa Kỳ.

Thomas Heldrup, người đứng đầu bộ phận bảo vệ và thực thi nội dung của nhóm, cho biết: "Một mặt, thật an ủi khi thấy rằng việc biên soạn các tập dữ liệu đào tạo AI bằng cách tải xuống hàng triệu cuốn sách từ các trang web chia sẻ tệp bất hợp pháp phải trả giá".

Mặt khác, Heldrup cho biết việc phát triển doanh nghiệp trước rồi sau đó nộp một khoản tiền phạt tương đối nhỏ so với quy mô của doanh nghiệp khi vi phạm các quy tắc là phù hợp với chiến lược của ngành công nghệ.

Heldrup cho biết: "Tôi hiểu rằng các công ty này coi một thỏa thuận như thỏa thuận với Anthropic là cái giá phải trả cho việc kinh doanh trong một không gian cạnh tranh khốc liệt".

Công ty tư nhân Anthropic, được thành lập bởi các cựu lãnh đạo của OpenAI vào năm 2021, đầu tuần này đã định giá công ty ở mức 183 tỷ đô la sau khi huy động thêm 13 tỷ đô la đầu tư.

Anthropic cũng cho biết họ hy vọng sẽ đạt doanh thu 5 tỷ đô la trong năm nay nhưng giống như OpenAI và nhiều công ty khởi nghiệp AI khác, công ty chưa bao giờ báo cáo có lãi, thay vào đó, họ phải dựa vào các nhà đầu tư để hỗ trợ chi phí cao trong việc phát triển công nghệ AI với kỳ vọng về lợi nhuận trong tương lai.

Thỏa thuận dàn xếp này có thể ảnh hưởng đến các tranh chấp khác, bao gồm vụ kiện đang diễn ra của các tác giả và báo chí chống lại OpenAI và đối tác kinh doanh Microsoft, cũng như các vụ kiện chống lại Meta và Midjourney. Và ngay khi các điều khoản dàn xếp của Anthropic được đệ trình, một nhóm tác giả khác đã kiện Apple vào ngày 5/9 tại cùng tòa án liên bang San Francisco.

Long, nhà phân tích pháp lý, cho biết: "Điều này chỉ ra rằng có thể trong những trường hợp khác, các nhà sáng tạo và công ty AI có thể đạt được thỏa thuận mà không cần phải ra tòa".

Nguồn: AP

Minh Tú (dịch)

Nguồn Phụ Nữ VN: https://phunuvietnam.vn/phai-tra-cho-cac-tac-gia-15-ty-do-la-vi-dung-sach-lau-dao-tao-chatbot-ai-20250911211532985.htm