Chật vật phân biệt con người với AI
Ngành xuất bản sách hiện có rất ít cơ chế để phát hiện và ngăn chặn việc vô tình phát hành một cuốn sách phần lớn do trí tuệ nhân tạo (AI) tạo ra, theo New York Times.

Nhiều tháng qua, cộng đồng mạng rộ lên suy đoán rằng tiểu thuyết kinh dị Shy Girl (tạm dịch: Cô gái nhút nhát) viết với sự hỗ trợ của AI.
Độc giả nghi ngờ, công cụ phát hiện AI vào cuộc
Truyện kể về cô gái trẻ bị một người đàn ông quen qua mạng bắt cóc rồi ép sống như thú cưng của hắn, ra mắt ở hình thức tự xuất bản vào tháng 2/2025. Sách nhanh chóng thu hút độc giả dòng kinh dị. Tập đoàn Hachette đã mua để phát hành tại Vương quốc Anh vào mùa thu năm ngoái, dự định ra mắt tại Mỹ vào mùa xuân năm nay, quảng bá đây là "tiểu thuyết kinh dị báo thù trần trụi, không khoan nhượng".
Sau khi sách phát hành tại Anh, ngày càng nhiều độc giả bày tỏ nghi ngờ tác giả đã sử dụng AI, đưa ra bằng chứng là các ẩn dụ vô nghĩa và lối diễn đạt lặp lại, kỳ lạ. Làn sóng cáo buộc dâng cao vào cuối tháng 1, nhưng Hachette vẫn giữ im lặng.
Đầu năm nay, Max Spero, nhà sáng lập kiêm giám đốc điều hành Pangram - một chương trình phát hiện AI - biết đến cáo buộc xoay quanh Shy Girl và quyết định kiểm tra toàn bộ tiểu thuyết này. Kết quả cho thấy cuốn sách có tới 78% nội dung do AI tạo ra. Spero đăng tải nghiên cứu của mình lên X vào tháng 1.

Bìa sách tiểu thuyết kinh dị Shy Girl phiên bản tự xuất bản (trái) và phiên bản phát hành ở Vương quốc Anh. Ảnh: Sonny Figueroa/NYT.
Tờ The Times cũng phân tích các đoạn trích từ tiểu thuyết bằng nhiều công cụ phát hiện AI và nhận thấy những dấu hiệu đặc trưng của văn bản do máy tạo ra lặp lại nhiều lần, như lỗ hổng logic, lạm dụng tính từ kịch tính và phụ thuộc quá mức vào quy tắc ba (một quy tắc viết lách cho rằng một cụm ba sự kiện hay nhân vật thì vừa đủ ngắn gọn và gây hài hước, do đó dễ nhớ hơn).
Sau khi biết đến cáo buộc về Shy Girl, chuyên gia tư vấn xuất bản Thad McIlroy đã đưa bản sách cho ba công cụ Pangram, GPTZero và Originality.ai kiểm tra. Cả ba đều kết luận văn bản khả năng cao do AI tạo ra một phần hoặc phần lớn. Pangram chỉ ra những cụm như "khoảnh khắc im lặng như con dao cắm vào ngực tôi, sắc bén và không lay chuyển" hay "tôi áp điện thoại lên môi, màn hình lạnh lẽo và không lay chuyển" mang dấu hiệu đặc trưng của chatbot.
Trả lời The New York Times, Hachette cho biết Nhà xuất bản Orbit của họ đã hủy kế hoạch phát hành cuốn sách tại Mỹ, đồng thời sẽ ngừng xuất bản tại Anh.
Theo phần giới thiệu, tác giả của Shy Girl, Mia Ballard, là một người viết thơ sống ở Bắc California. Cô gần như không hiện diện trên mạng xã hội và cũng không công khai phản hồi các cáo buộc. Trong một email gửi The Times vào 19/3, Ballard phủ nhận sử dụng AI viết sách, cho rằng một người quen mà cô thuê chỉnh sửa bản tự xuất bản đã sử dụng AI.
Người phát ngôn của Hachette cho biết quyết định hủy phát hành đưa ra sau quá trình phân tích kỹ lưỡng và kéo dài, nhấn mạnh rằng công ty đề cao sáng tạo của con người và yêu cầu tác giả xác nhận tác phẩm là nguyên gốc và khai báo việc sử dụng AI.
Vượt vòng kiểm định của nhà xuất bản lớn
Shy Girl dường như là tiểu thuyết thương mại đầu tiên từ một nhà xuất bản lớn bị thu hồi do bằng chứng liên quan đến AI. Sự việc cho thấy văn bản do AI tạo ra không chỉ xuất hiện trong ebook tự xuất bản giá rẻ tràn ngập Amazon, mà còn đang len lỏi vào cả hệ thống xuất bản truyền thống.
Việc Shy Girl có thể đi xa đến vậy trong quy trình biên tập, thậm chí phát hành tại Anh trước khi bị điều tra kỹ lưỡng, cho thấy ngành xuất bản đang thiếu chuẩn bị trước sự trỗi dậy của AI. Nó cũng báo hiệu một kỷ nguyên mới đầy bất định, khi cả biên tập viên lẫn độc giả phải tự hỏi liệu văn bản mình đang đọc là do con người hay máy móc viết ra.
Rất ít nhà xuất bản hoặc biên tập viên sẵn sàng phát biểu công khai về cách đối mặt với AI, bởi công nghệ này vẫn còn gây tranh cãi và mơ hồ về mặt đạo đức. Tuy vậy, một số lãnh đạo ngành xuất bản lo ngại rằng khó có thể ngăn chặn AI xâm nhập, nhất là khi công nghệ ngày càng tinh vi.
"Cũng giống với vấn đề đạo văn, bạn phải đặt niềm tin vào tác giả. Chúng tôi phải tin tưởng đối tác của mình", Morgan Entrekin, điều hành nhà xuất bản Grove Atlantic, chia sẻ.
Hiện tại, tác động rõ rệt nhất của AI đang diễn ra trong lĩnh vực tự xuất bản, mà nhiều tác giả nhận định đã “ngập lụt” nội dung AI kém chất lượng. Nhưng nhiều người trong ngành tin rằng sách do AI viết lọt qua khâu biên tập của các nhà xuất bản lớn chỉ là vấn đề thời gian. Công nghệ ngày càng phổ biến, còn nhà xuất bản truyền thống cũng thường xuyên mua lại sách tự xuất bản để tái phát hành. Thad McIlroy cho đây là lẽ tất yếu, và mọi chuyện đã bắt đầu.
Hiện gần như không thể đo lường chính xác có bao nhiêu văn bản do AI viết đang được xuất bản, nhưng có bằng chứng cho thấy công nghệ này đã góp phần làm bùng nổ số lượng sách. Năm ngoái, có hơn 3,5 triệu cuốn sách tự xuất bản, tăng từ 2,5 triệu vào năm 2024, theo dữ liệu của Bowker. Trong khi đó, các nhà xuất bản truyền thống phát hành chỉ hơn 642.000 đầu sách.
Tuhin Chakrabarty, giáo sư khoa học máy tính tại Đại học Stony Brook, đã dùng Pangram để kiểm tra hơn 14.000 tiểu thuyết tự xuất bản trên Amazon, chủ yếu trong giai đoạn 2024-2025. Kết quả cho thấy gần 20% số này có phần đáng kể do AI viết.

Ông Tuhin Chakrabarty, giáo sư khoa học máy tính tại Đại học Stony Brook, đánh giá công cụ Pangram nhận diện đúng các mẫu ngôn ngữ của chatbot. Ảnh: Columbia University.
Dù các công cụ phát hiện đôi khi nhầm lẫn, Chakrabarty cho biết ông tin Pangram đang nhận diện đúng các mẫu ngôn ngữ của chatbot. Công cụ này được thiết kế để phát hiện các cấu trúc ngôn ngữ thường thấy ở các mô hình ngôn ngữ lớn như ChatGPT hay Gemini, với tỷ lệ dự đoán sai khoảng 1/10.000, theo Spero. Pangram cũng có thể phát hiện thao tác cố tình chỉnh sửa để che vết AI.
Danh sách của Chakrabarty tập trung vào những cuốn được độc giả đón nhận, dựa trên số lượng đánh giá trên Goodreads và điểm trung bình. Trong bảng xếp hạng theo số lượt đánh giá cao nhất, Shy Girl thuộc số những cuốn nổi bật, với hơn 4.840 lượt đánh giá và điểm trung bình 3,5 sao. Tuy nhiên, bài đánh giá đầu tiên lại chấm 1 sao, nhận xét: "Tôi khá chắc đây là do ChatGPT viết".
Nhà văn Olivie Blake, từng viết lời giới thiệu khen ngợi Shy Girl, cho biết bà "thực sự thất vọng khi nghe rằng có thể sách có dùng AI", và khẳng định "AI không có chỗ trong nghệ thuật". Bà nói khi đọc sách đã tin đây là tác phẩm của con người và thấy nó "táo bạo, sáng tạo và độc đáo đến đáng sợ". Song bà cũng nói thêm rằng "Mia Ballard là nữ tác giả da màu ở vị thế rất dễ tổn thương trong ngành xuất bản, nên tôi không muốn vội vàng kết luận".
Ranh giới mong manh
Nhiều nhà xuất bản hiện không ghi rõ cấm sử dụng AI trong hợp đồng, mà dựa vào điều khoản yêu cầu tác phẩm phải "nguyên gốc". Trong khi đó, ngày nay nhiều người hiểu là ngầm cấm dùng AI để tạo nội dung văn bản hoặc hình ảnh.
Họ cũng dè chừng vì nội dung do AI tạo ra hiện chưa được bảo hộ bản quyền. Tuy nhiên, do AI được sử dụng rộng rãi trong nghiên cứu, lập dàn ý và các khâu khác, ranh giới sử dụng phù hợp vẫn rất mơ hồ. Nhiều người lo ngại điều này khiến các nhà xuất bản dễ bị lừa, hoặc gặp phải tác giả không nhận thức rằng việc họ dùng AI đã vượt qua giới hạn.
Một vấn đề khác là các nhà xuất bản không muốn cấm AI hoàn toàn. Biên tập viên hiểu rằng tác giả có thể dùng AI theo nhiều cách mà không trực tiếp để công cụ viết văn bản. Đồng thời, giới lãnh đạo cũng muốn nhân viên tận dụng công nghệ này trong tiếp thị, thu âm sách nói hay dịch thuật.
Thiếu vắng ranh giới rõ ràng đang gây ra sự mơ hồ: một tiểu thuyết gia có thể nhờ AI gợi ý tình tiết, đề xuất một kết thúc khác hay chỉnh sửa bản thảo mà vẫn coi đó là tác phẩm nguyên gốc không? Khi nào thì tác phẩm không còn là của con người?
Nghi ngờ lan rộng về việc tác giả dùng AI đặt nhà xuất bản vào thế khó. Nhiều người vẫn xem xuất bản truyền thống là "pháo đài cuối cùng" của văn chương nguyên bản do con người chọn lọc và biên tập. Nếu AI có thể tạo ra những tác phẩm hấp dẫn mà người đọc và biên tập viên không phân biệt được nguồn gốc, vai trò định hình gu thẩm mỹ của nhà xuất bản có thể bị xói mòn.
"Đây là vấn đề thực sự, và chúng ta cần các rào chắn" theo Mary Rasenberger, giám đốc điều hành Authors Guild. Bà cho rằng có những người tin chất lượng AI chưa đủ để cạnh tranh với con người, nhưng với các mô hình ngôn ngữ lớn (LLM) mới, điều đó không còn đúng.
Sử dụng AI trong viết lách vẫn gây chia rẽ sâu sắc. Một số xem đó là gian lận, đặc biệt khi độc giả không biết mình đang đọc nội dung do chatbot tạo ra. Số khác gọi đó là hành vi "ăn cắp", bởi lẽ nhiều AI được huấn luyện bằng tác phẩm có bản quyền mà không được cấp phép.
Seth Fishman, một đại diện văn học, cho biết phần lớn các tác giả mà ông đại diện phản đối dùng AI để viết. "Với tác giả, đây không chỉ là công nghệ, mà là vấn đề đạo đức. Họ cảm thấy tác phẩm của mình đã bị đánh cắp", ông nói.
Trước Shy Girl, trong ngành đã có tin đồn về những trường hợp suýt lọt lưới, nhà xuất bản kịp thời phát hiện việc dùng AI trước khi sách phát hành.
Có trường hợp, biên tập viên nghi ngờ vì một số đoạn văn quá nhạt nhẽo; tác giả sau đó thừa nhận đã dùng AI để chỉnh sửa. Một nhà xuất bản khác cũng hủy phát hành một cuốn sách vì phát hiện văn bản có AI hỗ trợ.
Hiện chưa có đồng thuận về cách kiểm soát nội dung AI. Một số đại diện và biên tập viên cho rằng cần quy định rõ ràng hơn để tránh nhầm lẫn hoặc gian lận.
Penguin Random House đã đưa ra hướng dẫn về việc sử dụng AI, trong khi HarperCollins, Simon & Schuster và Macmillan không chia sẻ chi tiết chính sách ngoài việc nhấn mạnh điều khoản "tính nguyên gốc".
Tuy nhiên, sự mơ hồ và kỳ thị xoay quanh AI có thể khiến tác giả càng ít minh bạch hơn. "Càng tránh né thảo luận, thì người ta càng dễ lạm dụng. Nỗi xấu hổ về AI đang gây hại nhiều hơn là giúp ích", Chakrabarty nói.
(*) Trong bài có sử dụng hình vẽ minh họa của George Wylesol.
Nguồn Znews: https://znews.vn/chat-vat-phan-biet-con-nguoi-voi-ai-post1636783.html












