Cuộc chiến giữa giới nhà văn và Meta về phát triển AI

Meta tiếp tục bị giới tác giả chỉ trích vì sử dụng trái phép tác phẩm của họ để phát triển AI, theo Forbes.

 Ảnh: Reuters,

Ảnh: Reuters,

Đa phần giới nhà văn đều biết đến LibGen, hay Library Genesis, một kho lưu trữ số chứa tài sản trí tuệ bị đánh cắp. Người dùng có thể tìm được rất nhiều cuốn sách lậu, bài báo học thuật và nhiều tác phẩm khác nhau mà tác giả và nhà xuất bản không bao giờ chấp thuận cho việc đăng tải công khai như vậy.

Vạch trần hành vi lậu của Meta

Nhưng giờ đây, có điều còn đáng lo ngại hơn sự tồn tại của LibGen. Trong các tài liệu tòa án được đệ trình gần đây, Meta, do người sáng lập kiêm giám đốc điều hành Mark Zuckerberg đứng đầu, bị cáo buộc đã cố tình và cho phép đội ngũ phát triển của họ tiếp cận LibGen và Anna's Archive, một thiên đường lưu trữ số trái phép khác, để phát triển mô hình AI mới nhất Llama 3.

Các tác giả trên khắp thế giới đều kinh ngạc. Họ không hề được ghi nhận công lao, cả về mặt tài chính hoặc thông qua lời tri ân, và những tác phẩm của họ đã vô tình được tải lên một mô hình ngôn ngữ lớn (LLM).

Báo cáo điều tra xuất sắc của Alex Reisner tại The Atlantic đã vạch trần mặt trái của "sự đổi mới" mà Meta vẫn mô tả. Nội dung chính là ban quản lý cấp cao của Meta thừa nhận rằng họ rất cần nội dung chất lượng cao để đưa vào LLM. "Sách cần thiết hơn dữ liệu web", một email từ nhân sự Meta thừa nhận.

Đội ngũ nhân viên của Meta đã tiếp cận LibGen, nơi lưu trữ hơn 7,5 triệu cuốn sách vi phạm bản quyền và 81 triệu bài báo nghiên cứu bị đánh cắp, để lấp đầy khoảng trống đó. Họ cũng làm tương tự với Anna's Archive.

Sau các cuộc thảo luận nội bộ, các tài liệu của tòa án cho thấy chính Zuckerberg đã bật đèn xanh cho hành vi này.

Thiệt hại về phía tác giả

Theo Forbes, những hành vi của Meta không chỉ mang lại cảm giác khó chịu đối với các tác giả mà nên được coi là một cuộc khủng hoảng đạo đức đáng được mọi người chú ý, trong đó có Trung tâm điều phối quyền sở hữu trí tuệ quốc gia Mỹ.

 The Atlantic giới thiệu công cụ tìm kiếm cho phép tác giả tìm kiếm tác phẩm bị đánh cắp của mình. Ảnh: The Atlantic.

The Atlantic giới thiệu công cụ tìm kiếm cho phép tác giả tìm kiếm tác phẩm bị đánh cắp của mình. Ảnh: The Atlantic.

Các tác giả kiếm được rất ít tiền từ sách. Đối với hầu hết tác giả, thu nhập khi viết sách là rất khiêm tốn. Khoản tiền đó chỉ trang trải được một vài khoản thanh toán thế chấp và nếu may mắn, nó có thể nhiều hơn một chút.

Đối với một số tác giả, nghề viết không hoàn toàn là để kiếm tiền nhanh. Trên hết, mục đích của họ là thể hiện ý tưởng, quá trình học hỏi và đóng góp một điều gì đó có ý nghĩa cho xã hội.

Trong khi đó, hành vi của Zuckerberg và Meta, nếu được chứng minh là vi phạm, không chỉ không công bằng, thậm chí có thể coi là bóc lột.

Meta, với doanh thu 164,5 tỷ USD vào năm 2024 và có lợi nhuận gần 62,4 tỷ USD, có thể dễ dàng đàm phán các thỏa thuận với các nhà xuất bản và tác giả.

Họ thậm chí có thể đóng vai trò là người dẫn đầu về dữ liệu LLM và xúc tiến các thỏa thuận được cấp phép tôn trọng quyền của tác giả.

Tuy nhiên, khi các kỹ sư của Meta nhận ra rằng họ cần nội dung chất lượng cao để khiến Llama 3 có sức cạnh tranh, nhóm đã không ngần ngại hành động với LibGen và Anna Archive. Tại sao phải trả công cho tác giả và nhà xuất bản một cách công bằng khi các kỹ sư của Meta có thể khai thác tài sản trí tuệ của họ miễn phí?

Và khi đối mặt với chỉ trích, Meta đã loay hoay với cách biện hộ "sử dụng hợp lý" cũ rích và nhàm chán khi đối mặt với luật sư và thẩm phán. Tuy nhiên, các lập luận về việc sử dụng hợp lý, một ngoại lệ của luật bản quyền, là để hỗ trợ giáo dục, khuyến khích bình luận và thảo luận, thay vì để doanh nghiệp khai thác và kiếm lợi nhuận thương mại ở quy mô lớn.

Dựa trên báo cáo tài chính năm 2024, Meta không phải là một giáo viên đang vật lộn ở vùng sâu vùng xa và cần sao chép các trang sách giáo khoa cho học sinh của họ. Meta được xếp hạng trong số 10 công ty có giá trị nhất thế giới. Vốn hóa thị trường của Meta vào khoảng 1,8 nghìn tỷ USD, tính đến tháng 3 năm nay.

Giới tác giả hành động

Một số nhà sáng tạo đã đệ đơn kiện tập thể cáo buộc Meta vi phạm bản quyền và cạnh tranh không lành mạnh. Kết quả của vụ kiện tụng này có thể mở đường cho việc xác định cách các công ty có thể thu thập dữ liệu cho LLM của họ trong tương lai.

Trong khi tiến trình kiện có thể kéo dài và chưa rõ phán quyết, các công ty AI và công nghệ sẽ tiếp tục phải đối mặt với sự giám sát chặt chẽ đối với các hoạt động cung cấp dữ liệu LLM.

Hành động của Meta càng cho thấy sự liều lĩnh trên quy mô lớn trong toàn bộ hệ sinh thái AI. Và chính các công ty thậm chí còn ăn cắp của nhau, như cáo buộc của OpenAI đối với chủ sở hữu của DeepSeek.

Bối cảnh này càng đòi hỏi sự minh bạch và các hướng dẫn đạo đức cụ thể cho việc phát triển các chương trình LLM AI. Sự đổi mới không thể đem ra bào chữa cho việc khai thác trái phép chất xám của người khác.

Nếu được chứng minh là vô tội, hành vi của Meta sẽ tạo ra một tiền lệ nguy hiểm và có thể khiến giới tác giả suy nghĩ lại về cách họ sáng tạo. Có thể nói cuộc chiến về sở hữu trí tuệ và việc sử dụng hợp lý các mô hình AI sẽ quyết định tương lai của ngành xuất bản.

Minh Hoa

Nguồn Znews: https://znews.vn/cuoc-chien-giua-gioi-nha-van-va-meta-ve-phat-trien-ai-post1541407.html