OpenAI phản đối lệnh giao nộp 20 triệu nhật ký trò chuyện ChatGPT
OpenAI yêu cầu một thẩm phán liên bang tại New York (Mỹ) đảo ngược lệnh yêu cầu công ty này giao nộp 20 triệu nhật ký trò chuyện ChatGPT ẩn danh trong bối cảnh bị tờ The New York Times và các hãng tin khác kiện vi phạm bản quyền.
Theo OpenAI, điều này sẽ làm lộ các cuộc trò chuyện riêng tư của người dùng ChatGPT.
OpenAI lập luận rằng việc giao nộp nhật ký sẽ tiết lộ thông tin bí mật của người dùng và "99,99% bản ghi không liên quan gì đến các cáo buộc vi phạm bản quyền trong vụ việc".
"Nói rõ hơn: Bất kỳ ai trên thế giới đã sử dụng ChatGPT trong ba năm qua giờ đây đều phải đối mặt với khả năng các cuộc trò chuyện cá nhân của họ sẽ bị chuyển giao cho The New York Times để tùy ý rà soát trong một nỗ lực tìm kiếm bằng chứng mang tính suy đoán", OpenAI cho biết trong hồ sơ tòa án.
Các hãng tin lập luận rằng nhật ký là cần thiết để xác định liệu ChatGPT có sao chép nội dung có bản quyền của họ không và để bác bỏ khẳng định từ OpenAI rằng họ đã can thiệp vào phản hồi của ChatGPT nhằm tạo ra bằng chứng giả. Vụ kiện cáo buộc OpenAI đã lạm dụng các bài viết của các hãng tin để huấn luyện ChatGPT phản hồi các yêu cầu từ người dùng.
Ona Wang, thẩm phán ra lệnh yêu cầu OpenAI nộp dữ liệu trò chuyện, nói quyền riêng tư của người dùng sẽ được bảo vệ thông qua quy trình “ẩn danh toàn diện” và các biện pháp bảo đảm khác. OpenAI có hạn chót đến 15.11 để giao nộp các bản ghi.
Trong một bài đăng trên blog hôm 12.11, Dane Stuckey, Giám đốc an ninh thông tin OpenAI, cho rằng việc chia sẻ nhật ký sẽ vi phạm các biện pháp bảo vệ quyền riêng tư, bảo mật và "buộc chúng tôi phải chuyển giao hàng chục triệu cuộc trò chuyện mang tính cá nhân sâu sắc từ những người không liên quan đến vụ kiện vô căn cứ của The New York Times".
Theo một phát ngôn viên của The New York Times, bài đăng trên blog OpenAI "cố tình gây hiểu lầm cho người dùng và bỏ qua sự thật".
"Quyền riêng tư của người dùng ChatGPT không bị đe dọa. Tòa án đã ra lệnh cho OpenAI cung cấp mẫu trò chuyện được chính OpenAI ẩn danh, được bảo vệ bằng lệnh pháp lý", người phát ngôn The New York Times cho hay.

OpenAI yêu cầu một thẩm phán liên bang tại New York đảo ngược lệnh yêu cầu công ty này giao nộp 20 triệu nhật ký trò chuyện ChatGPT ẩn danh - Ảnh: Internet
Vụ kiện OpenAI này là một trong nhiều vụ đang chờ xử lý nhắm vào các hãng công nghệ bị cáo buộc sử dụng trái phép nội dung có bản quyền để huấn luyện mô hình AI.
Hôm 11.11, tòa án ở Munich (Đức) ra phán quyết lịch sử, xác định ChatGPT vi phạm bản quyền khi tái tạo lời bài hát của nhạc sĩ Herbert Groenemeyer và nhiều nghệ sĩ khác. Quyết định này đánh dấu một thắng lợi đáng kể cho giới nghệ sĩ toàn cầu trong cuộc chiến chống lại việc thu thập dữ liệu phục vụ AI.
Vụ kiện này được khởi xướng bởi GEMA - Hiệp hội Quyền Âm nhạc Đức, đại diện cho các nhà soạn nhạc, viết lời và nhà xuất bản âm nhạc. Tòa án ở Munich xác định rằng OpenAI đã sử dụng nội dung có bản quyền từ 9 ca khúc Đức, trong đó có hai bản hit Maenner và Bochum của Herbert Groenemeyer, để huấn luyện mô hình ngôn ngữ lớn làm nền tảng cho ChatGPT.
Thẩm phán Elke Schwager yêu cầu OpenAI bồi thường thiệt hại cho việc sử dụng trái phép tài liệu có bản quyền, nhưng số tiền cụ thể chưa được công bố.
Kai Welp, đại diện pháp lý của GEMA, hy vọng rằng phán quyết này sẽ mở ra cơ hội đối thoại với OpenAI về cơ chế bồi thường hợp lý cho các chủ sở hữu bản quyền.
The New York Times kiện OpenAI vì sử dụng hàng triệu bài báo không được phép
Cuối năm 2023, The New York Times đã đâm đơn kiện OpenAI và Microsoft, cáo buộc hai công ty này đã sử dụng hàng triệu bài báo của hãng mà không được phép để huấn luyện các mô hình ngôn ngữ lớn làm nền tảng cho chatbot ChatGPT.
Theo đơn kiện, OpenAI và Microsoft đã sao chép nội dung từ các bài báo của The New York Times, gồm cả kết quả điều tra và đoạn trích quan trọng, để đưa vào kho dữ liệu huấn luyện mô hình ngôn ngữ lớn. Sau đó, mô hình ngôn ngữ lớn đưa ra các đoạn nội dung gần như nguyên văn trên The New York Times khi người dùng đặt câu hỏi. The New York Times lập luận điều này không chỉ vi phạm bản quyền mà còn “làm suy yếu” mô hình kinh doanh báo chí khi người đọc có thể truy vấn thông tin mà không cần đăng ký trả phí.
OpenAI phản hồi rằng các mô hình ngôn ngữ lớn của họ được đào tạo trên dữ liệu công khai và dựa trên nguyên tắc fair use (sử dụng hợp lý) trong luật bản quyền.
Fair use là khái niệm trong luật bản quyền của Mỹ, cho phép sử dụng một phần tác phẩm có bản quyền mà không cần xin phép chủ sở hữu trong một số trường hợp nhất định, miễn là việc sử dụng đó mang tính hợp lý, không gây thiệt hại đáng kể cho chủ sở hữu bản quyền.
Với The New York Times, kết quả vụ kiện có thể ảnh hưởng sâu rộng tới tương lai của ngành báo và cách các công ty AI sử dụng dữ liệu báo chí. Với OpenAI và Microsoft, đây là bước quan trọng trong việc xác định giới hạn pháp lý của việc sử dụng dữ liệu để huấn luyện mô hình ngôn ngữ lớn.













