Vụ kiện bản quyền sách ở Mỹ: AI có quyền sử dụng các tác phẩm văn học để huấn luyện ngôn ngữ?
Thẩm phán liên bang William Alsup tại San Francisco đã phán quyết vào hôm 24.6 rằng việc Công ty Anthropic sử dụng sách mà không có sự cho phép để huấn luyện hệ thống trí tuệ nhân tạo (AI) của mình là hợp pháp theo luật bản quyền của Mỹ.

Các công ty AI có thể sử dụng hợp pháp mọi tác phẩm văn học để huấn luyện
Thẩm phán William Alsup thể hiện quan điểm ủng hộ các công ty công nghệ trong một vấn đề then chốt đối với ngành công nghiệp AI. Ông cho rằng Anthropic đã thực hiện hành vi “sử dụng hợp lý” (fair use) đối với các tác phẩm của các nhà văn như Andrea Bartz, Charles Graeber và Kirk Wallace Johnson để huấn luyện mô hình ngôn ngữ lớn Claude của mình.
Anthropic "hài lòng" ra mặt
Người phát ngôn của Anthropic cho biết công ty hài lòng khi tòa án công nhận rằng việc huấn luyện AI của họ là “mang tính chuyển hóa” và “phù hợp với mục tiêu của luật bản quyền trong việc thúc đẩy sáng tạo và tiến bộ khoa học”.
Các nhà văn đã đệ đơn kiện tập thể đối với Anthropic vào năm ngoái. Họ cho rằng công ty – được Amazon và Alphabet hậu thuẫn – đã sử dụng phiên bản lậu của các cuốn sách của họ mà không có sự cho phép hay bồi thường để dạy Claude phản hồi các yêu cầu từ con người.
Vụ kiện tập thể nói trên là một trong nhiều vụ kiện mà các tác giả, cơ quan báo chí và chủ sở hữu bản quyền khác đã đệ trình chống lại các công ty như OpenAI, Microsoft và Meta Platforms liên quan đến việc huấn luyện AI.
Nguyên tắc "sử dụng hợp lý" cho phép sử dụng các tác phẩm có bản quyền mà không cần sự đồng ý của chủ sở hữu bản quyền trong một số hoàn cảnh nhất định. Đây là một biện hộ pháp lý then chốt cho các công ty công nghệ và quyết định của Alsup là phán quyết đầu tiên đề cập trực tiếp đến vấn đề này trong bối cảnh AI tạo sinh.
Vấn đề mấu chốt: sử dụng hợp lý
Các công ty AI lập luận rằng hệ thống của họ sử dụng hợp lý các tài liệu có bản quyền để tạo ra nội dung mới, mang tính chuyển hóa, và rằng nếu buộc phải trả tiền cho chủ bản quyền, thì điều đó có thể làm tê liệt ngành AI non trẻ.
Anthropic đã lập luận trước tòa rằng họ thực hiện “sử dụng hợp lý” đối với các cuốn sách và luật bản quyền Mỹ “không chỉ cho phép mà còn khuyến khích” hành vi huấn luyện AI vì nó thúc đẩy sự sáng tạo của con người. Công ty cho biết hệ thống của họ sao chép các cuốn sách nhằm “nghiên cứu văn phong của nguyên đơn, trích xuất thông tin không thuộc bản quyền và sử dụng những gì học được để tạo ra công nghệ mang tính cách mạng”.
Các chủ sở hữu bản quyền cho rằng các công ty AI đang sao chép trái phép tác phẩm của họ để tạo ra nội dung cạnh tranh, đe dọa đến kế sinh nhai của họ.
Thẩm phán Alsup đã đồng ý với Anthropic rằng hoạt động huấn luyện của công ty là “cực kỳ mang tính chuyển hóa”. Ông Alsup nhận định: “Giống như một người đọc mong muốn trở thành nhà văn, các mô hình ngôn ngữ của Anthropic được huấn luyện trên các tác phẩm không phải để sao chép hay thay thế chúng — mà để rẽ hướng và sáng tạo ra điều gì đó khác biệt”.
Tuy nhiên, ông cũng nhấn mạnh rằng Anthropic đã vi phạm quyền của các tác giả khi lưu trữ các bản sao lậu của sách như một phần của “thư viện trung tâm chứa tất cả sách trên thế giới”, trong đó không phải mọi tài liệu đều được dùng cho huấn luyện AI.
Thẩm phán đã ra lệnh tổ chức một phiên tòa vào tháng 12 tới để xác định mức bồi thường mà Anthropic phải trả vì hành vi xâm phạm bản quyền này. Luật bản quyền Mỹ quy định rằng hành vi vi phạm bản quyền có chủ đích có thể bị phạt bồi thường lên tới 150.000 USD cho mỗi tác phẩm.