Chi tiết khác lạ vụ PV New York Times kiện OpenAI, Google, Anthropic, xAI, Meta

8 giờ trước Gốc

John Carreyrou, phóng viên điều tra nổi tiếng với việc phanh phui gian lận tại Theranos, vừa đệ đơn kiện OpenAI, Google, xAI, Anthropic, Meta và Perplexity.

Ông cáo buộc các công ty này sử dụng sách có bản quyền trái phép để huấn luyện mô hình ngôn ngữ lớn (công nghệ nền tảng cho chatbot trí tuệ nhân tạo).

John Carreyrou, phóng viên tờ New York Times và tác giả cuốn sách Bad Blood, đã nộp đơn kiện tại tòa án liên bang ở California (Mỹ) cùng 5 nhà văn khác, cáo buộc 6 công ty AI trên sao chép trái phép sách của họ và đưa vào các mô hình ngôn ngữ lớn.

Sự việc trên là một trong số nhiều vụ kiện do các tác giả và chủ sở hữu bản quyền khác đệ trình chống lại các hãng công nghệ vì sử dụng tác phẩm của họ trong huấn luyện AI. Đây là vụ kiện đầu tiên nêu tên xAI, công ty khởi nghiệp do Elon Musk điều hành, là bị đơn.

Một người phát ngôn của Perplexity cho biết công ty này “không lập chỉ mục sách”, hàm ý rằng không thu thập, quét hay lưu trữ nội dung sách để đưa vào hệ thống dữ liệu phục vụ huấn luyện hoặc vận hành mô hình AI.

Đại diện của 5 công ty bị đơn còn lại, gồm OpenAI, Google, xAI, Anthropic và Meta Platforms, chưa đưa ra phản hồi chính thức về vụ kiện.

Chi tiết khác lạ

Không như nhiều vụ khác đang chờ xét xử, John Carreyrou và 5 nhà văn không lựa chọn hợp nhất thành một vụ kiện tập thể quy mô lớn. Theo họ, hình thức kiện tụng như vậy thường có lợi cho bị đơn, vì cho phép các công ty chỉ cần đàm phán một thỏa thuận dàn xếp duy nhất để giải quyết yêu cầu bồi thường của nhiều nguyên đơn cùng lúc.

“Các công ty phát triển mô hình ngôn ngữ lớn không nên có khả năng dễ dàng dập tắt hàng nghìn, thậm chí hàng chục nghìn yêu cầu bồi thường có giá trị cao chỉ với mức đền bù rẻ mạt”, đơn kiện nêu rõ.

Anthropic từng đạt được thỏa thuận lớn trong một vụ tranh chấp bản quyền liên quan đến huấn luyện AI vào tháng 8, đồng ý chi trả 1,5 tỉ USD cho một nhóm tác giả cáo buộc công ty sao chép trái phép hàng triệu cuốn sách.

Đơn kiện từ John Carreyrou và 5 nhà văn cho biết các thành viên trong vụ kiện đó sẽ chỉ nhận được “một phần rất nhỏ (chỉ 2%) mức trần bồi thường theo luật định của Đạo luật Bản quyền là 150.000 USD” với mỗi tác phẩm bị xâm phạm.

Đơn kiện nộp hôm 22.12 do các luật sư của hãng luật Freedman Normand Friedland (Mỹ) thực hiện, trong đó có Kyle Roche - người từng được John Carreyrou phác họa trong một bài báo của New York Times năm 2023.

Trong phiên điều trần vào tháng 11 của vụ kiện tập thể chống Anthropic, Thẩm phán liên bang Mỹ William Alsup đã chỉ trích một hãng luật khác do Kyle Roche đồng sáng lập vì tập hợp các tác giả từ chối thỏa thuận dàn xếp để tìm kiếm "một thỏa thuận có lợi hơn".

Tại một phiên điều trần kế tiếp, John Carreyrou nói với thẩm phán rằng việc Anthropic đánh cắp sách để xây dựng AI là “sai lầm cơ bản” của công ty này và thỏa thuận dàn xếp trước đó vẫn chưa đủ nghiêm khắc để giải quyết vấn đề.

John Carreyrou kiện OpenAI, Google, xAI, Anthropic, Meta và Perplexity với cáo buộc sử dụng sách có bản quyền trái phép để huấn luyện mô hình ngôn ngữ lớn - Ảnh: Internet

Thành tích ấn tượng của John Carreyrou

John Carreyrou là phóng viên điều tra nổi tiếng người Mỹ gốc Pháp, sinh năm 1972. Trước khi gia nhập New York Times vào năm 2023, ông từng có hơn 20 năm công tác tại tờ The Wall Street Journal.

John Carreyrou được biết đến rộng rãi vì những phóng sự điều tra sâu rộng về các vụ bê bối doanh nghiệp và gian lận tài chính.

Thành tựu và giải thưởng

John Carreyrou hai lần đoạt giải Pulitzer, một trong những giải báo chí danh giá nhất ở Mỹ. Ông còn đoạt giải George Polk Award và Gerald Loeb Award cho các phóng sự điều tra.

George Polk Award là một trong những giải thưởng uy tín nhất dành cho nhà báo điều tra và báo chí xuất sắc ở Mỹ. Gerald Loeb Award là giải thưởng danh giá dành cho báo chí về kinh doanh, tài chính và kinh tế tại Mỹ.

Phanh phui Theranos

John Carreyrou nổi tiếng nhất với loạt bài điều tra về Theranos, công ty xét nghiệm máu tại Thung lũng Silicon từng được định giá gần 9 tỉ USD vào năm 2014. Ông phát hiện và công bố rằng công nghệ xét nghiệm mà Theranos quảng bá (cho phép thực hiện nhiều xét nghiệm chỉ từ một giọt máu) không hoạt động đúng như quảng cáo, gây nguy hiểm cho người bệnh và lừa dối nhà đầu tư.

Loạt phóng sự của John Carreyrou đã dẫn tới hàng loạt cuộc điều tra từ cơ quan chính phủ Mỹ, gồm cả Cục Quản lý Thực phẩm và Dược phẩm Mỹ (FDA) và Ủy ban Chứng khoán và Giao dịch Mỹ (SEC), cuối cùng khiến Theranos phá sản và nữ giám đốc điều hành Elizabeth Holmes bị kết án lừa đảo, với bản án tù kéo dài nhiều năm.

Elizabeth Holmes bị kết án 11 năm 3 tháng tù vào tháng 11.2022, song hiện được giảm án còn khoảng 8 năm rưỡi nhờ hành vi tốt và tham gia các chương trình lao động, đào tạo trong tù - Ảnh: Internet

Đây được xem là vụ điều tra báo chí có ảnh hưởng lớn của thập kỷ, phơi bày một trong những vụ gian lận doanh nghiệp lớn nhất lịch sử công nghệ Mỹ kể từ vụ tập đoàn năng lượng Enron.

Ban lãnh đạo Enron từng sử dụng các phương pháp kế toán phức tạp và sai trái, như ghi nhận lợi nhuận chưa thực tế, che giấu nợ và lỗ, để làm cho tập đoàn trông có lợi nhuận cao hơn thực tế. Điều này khiến cổ đông và công chúng tin rằng Enron đang rất thành công, dù thực tế kinh doanh tệ hơn nhiều.

Khi những sai phạm này bị phơi bày trong năm 2001, giá cổ phiếu Enron sụt giảm thảm hại từ mức gần 90 USD xuống còn vài cent. Các nhà đầu tư, nhân viên và người góp vốn mất hàng tỉ USD. Cuối cùng, Enron nộp đơn xin bảo hộ phá sản ngày 2.12.2001. Nhiều lãnh đạo Enron, gồm cả giám đốc điều hành và giám đốc tài chính, bị buộc tội gian lận, lạm dụng thị trường và âm mưu lừa đảo, dẫn đến kết án tù.

Cuốn sách Bad Blood

John Carreyrou từng viết cuốn sách Bad Blood: Secrets and Lies in a Silicon Valley Startup (Máu bẩn - Những bí mật và sự dối trá trong một khởi nghiệp tại Thung lũng Silicon) kể lại toàn bộ hành trình điều tra, những gian dối, che đậy và thất bại của Theranos. Cuốn sách này được đánh giá cao và giành giải sách kinh doanh của năm từ báo Financial Times.

New York Times kiện OpenAI vì sử dụng hàng triệu bài báo không được phép

Cuối năm 2023, The New York Times đã đâm đơn kiện OpenAI và Microsoft, cáo buộc hai công ty này đã sử dụng hàng triệu bài báo của hãng mà không được phép để huấn luyện các mô hình ngôn ngữ lớn làm nền tảng cho ChatGPT.

Theo đơn kiện, OpenAI và Microsoft đã sao chép nội dung từ các bài báo của New York Times, gồm cả kết quả điều tra và đoạn trích quan trọng, để đưa vào kho dữ liệu huấn luyện mô hình ngôn ngữ lớn. Sau đó, mô hình ngôn ngữ lớn đưa ra các đoạn nội dung gần như nguyên văn trên New York Times khi người dùng đặt câu hỏi. New York Times lập luận điều này không chỉ vi phạm bản quyền mà còn “làm suy yếu” mô hình kinh doanh báo chí khi người đọc có thể truy vấn thông tin mà không cần đăng ký trả phí.

OpenAI phản hồi rằng các mô hình ngôn ngữ lớn của họ được đào tạo trên dữ liệu công khai và dựa trên nguyên tắc fair use (sử dụng hợp lý) trong luật bản quyền.

Fair use là khái niệm trong luật bản quyền của Mỹ, cho phép sử dụng một phần tác phẩm có bản quyền mà không cần xin phép chủ sở hữu trong một số trường hợp nhất định, miễn là việc sử dụng đó mang tính hợp lý, không gây thiệt hại đáng kể cho chủ sở hữu bản quyền.

Với The New York Times, kết quả vụ kiện có thể ảnh hưởng sâu rộng tới tương lai của ngành báo và cách các công ty AI sử dụng dữ liệu báo chí. Với OpenAI và Microsoft, đây là bước quan trọng trong việc xác định giới hạn pháp lý của việc sử dụng dữ liệu để huấn luyện mô hình ngôn ngữ lớn.

Hồi tháng 11.2025, OpenAI yêu cầu một thẩm phán liên bang tại New York (Mỹ) đảo ngược lệnh yêu cầu công ty này giao nộp 20 triệu nhật ký trò chuyện ChatGPT ẩn danh trong bối cảnh bị New York Times và các hãng tin khác kiện vi phạm bản quyền.

Theo OpenAI, điều này sẽ làm lộ các cuộc trò chuyện riêng tư của người dùng ChatGPT.

OpenAI lập luận rằng việc giao nộp nhật ký sẽ tiết lộ thông tin bí mật của người dùng và "99,99% bản ghi không liên quan gì đến các cáo buộc vi phạm bản quyền trong vụ việc".

"Nói rõ hơn: Bất kỳ ai trên thế giới đã sử dụng ChatGPT trong ba năm qua giờ đây đều phải đối mặt với khả năng các cuộc trò chuyện cá nhân của họ sẽ bị chuyển giao cho New York Times để tùy ý rà soát trong một nỗ lực tìm kiếm bằng chứng mang tính suy đoán", OpenAI cho biết trong hồ sơ tòa án.

Các hãng tin lập luận rằng nhật ký là cần thiết để xác định liệu ChatGPT có sao chép nội dung có bản quyền của họ không và để bác bỏ khẳng định từ OpenAI rằng họ đã can thiệp vào phản hồi của ChatGPT nhằm tạo ra bằng chứng giả. Vụ kiện cáo buộc OpenAI đã lạm dụng các bài viết của các hãng tin để huấn luyện ChatGPT phản hồi các yêu cầu từ người dùng.

Ona Wang, thẩm phán ra lệnh yêu cầu OpenAI nộp dữ liệu trò chuyện, nói quyền riêng tư của người dùng sẽ được bảo vệ thông qua quy trình “ẩn danh toàn diện” và các biện pháp bảo đảm khác.

Trong một bài đăng trên blog hôm 12.11, Dane Stuckey, Giám đốc an ninh thông tin OpenAI, cho rằng việc chia sẻ nhật ký sẽ vi phạm các biện pháp bảo vệ quyền riêng tư, bảo mật và "buộc chúng tôi phải chuyển giao hàng chục triệu cuộc trò chuyện mang tính cá nhân sâu sắc từ những người không liên quan đến vụ kiện vô căn cứ của New York Times".

Một phát ngôn viên của New York Times tuyên bố bài đăng trên blog OpenAI "cố tình gây hiểu lầm cho người dùng và bỏ qua sự thật".

"Quyền riêng tư của người dùng ChatGPT không bị đe dọa. Tòa án đã ra lệnh cho OpenAI cung cấp mẫu trò chuyện được chính OpenAI ẩn danh, được bảo vệ bằng lệnh pháp lý", người phát ngôn New York Times cho hay.

Theo các nguồn tin từ tòa án, lệnh yêu cầu OpenAI nộp nhật ký đã được duy trì, tức là công ty phải tuân thủ lệnh trong khi tiếp tục kháng cáo.

Sơn Vân