OpenAI và Microsoft bác bỏ đơn kiện bản quyền của báo chí
OpenAI và Microsoft đã đệ đơn bác bỏ một phần các cáo buộc trong đơn kiện bản quyền của 8 tờ báo, cho rằng việc dùng các bài báo cũ miễn phí trên mạng không vi phạm bản quyền.
Tháng 4 vừa qua, liên mình 8 tờ báo thuộc sở hữu của MediaNews Group (Mercury News, Denver Post, Orange County Register, St. Paul Pioneer-Press) và Tribune (Chicago Tribune, Orlando Sentinel, South Florida Sun Sentinel, New York Daily News) đã đệ đơn kiện OpenAI và Microsoft.
Đơn kiện cáo buộc hai công ty này đã sử dụng các bài báo có bản quyền của 8 tờ báo trên khi chưa được phép hoặc chưa thanh toán, để "đào tạo" các mô hình ngôn ngữ lớn (LLM) giúp nâng cao khả năng của ChatGPT và Copilot trong việc tạo văn bản ngôn ngữ với phong cách khác nhau.
Lý lẽ của bị đơn
Mới đây, phía OpenAI và Microsoft đã đệ trình kiến nghị bác bỏ một phần cáo buộc này.
"Công cụ của Microsoft và OpenAI không khai thác, cũng không thay thế cách biểu đạt được bảo vệ bản quyền trong nội dung kỹ thuật số của nguyên đơn, mà chỉ trích xuất và chia sẻ các yếu tố ngôn ngữ, văn hóa, ý tưởng và kiến thức thuộc về tất cả chúng ta," Microsoft cho biết trong kiến nghị của mình.
Ví dụ: các nhà phát triển AI bất đồng với cáo buộc rằng "khi được gợi ý phù hợp", các sản phẩm AI sẽ "lặp lại phần lớn" các bài báo được sử dụng để đào tạo LLM.
Theo Microsoft và OpenAI, các tòa soạn không khẳng định được rằng các nhà phát triển AI đã góp phần vào "vi phạm bản quyền của người dùng cuối" hoặc khuyến khích người dùng gợi các công cụ dựa trên GPT để sản xuất nội dung tương tự các bài báo của họ.
Các nhà phát triển AI nói thêm rằng chỉ vì một người dùng có thể gợi ý các người dùng khác sử dụng công cụ dựa trên GPT để tạo ra tác phẩm vi phạm bài báo của tòa soạn thì không đủ để đưa ra cáo buộc bản quyền.
Microsoft nhận định: "Khả năng đơn thuần lý thuyết rằng ai đó ở đâu đó có thể ghép câu từ tương tự như nguyên đơn đã làm là không đủ hợp lý để cáo buộc hành vi vi phạm trực tiếp".
Tương tự, OpenAI cho biết khiếu nại đơn kiện không xem xét đầy đủ liệu sử dụng nội dung có bản quyền để đào tạo AI tạo sinh có phải là sử dụng hợp pháp theo luật bản quyền hay không. OpenAI cũng ám chỉ rằng các AI tạo sinh chỉ sử dụng "các đoạn báo cũ miễn phí sẵn có đầy đủ ở địa chỉ trực tuyến nào đó khác".
Kristelia Garcia, giáo sư luật tại Đại học Georgetown, nói rằng khả năng giả thuyết rằng người dùng GPT có thể tạo ra các bài báo của các tòa soạn là có thể đủ để cáo buộc vi phạm bản quyền. Bà cho rằng điều này chỉ là vấn đề thời gian và họ không cần đợi đến khi có thiệt hại.
Garcia nói thêm rằng kết quả vụ kiện phụ thuộc vào việc tòa án có giải thích yêu cầu của các báo đủ để đảm bảo một cuộc tranh luận bản quyền hay không.
OpenAI tuyên bố các nhà xuất bản cũng không đưa ra được yêu cầu bồi thường thiệt hại hợp lệ vì khi GPT trích dẫn bài báo có bản quyền, sẽ luôn kèm tên ấn bản và liên kết.
Các tòa báo cũng tuyên bố rằng tổng thể, nội dung từ trang web của họ chiếm ít nhất 124 triệu đoạn văn bản cơ bản có trong kho lưu trữ dữ liệu sử dụng để đào tạo LLM của các nhà phát triển AI.
Nhưng các nhà phát triển AI nói rằng sử dụng các bài viết của các tờ báo làm công cụ đào tạo không thể xem là vi phạm bản quyền vì nó "diễn ra ngoài tầm nhìn của công chúng".
Microsoft cho biết: "Khiếu nại không cáo buộc một cách chính đáng rằng việc đào tạo hoặc phát triển các mô hình bằng cách nào đó có thể tạo điều kiện thuận lợi để bị đơn hoặc ai khác vi phạm".