Chật vật phân biệt con người với AI

Ngành xuất bản sách hiện có rất ít cơ chế để phát hiện và ngăn chặn việc vô tình phát hành một cuốn sách phần lớn do trí tuệ nhân tạo (AI) tạo ra, theo New York Times.

6 giờ trướcGốc

Nhiều tháng qua, cộng đồng mạng rộ lên suy đoán rằng tiểu thuyết kinh dị Shy Girl (tạm dịch: Cô gái nhút nhát) viết với sự hỗ trợ của AI.

Độc giả nghi ngờ, công cụ phát hiện AI vào cuộc

Truyện kể về cô gái trẻ bị một người đàn ông quen qua mạng bắt cóc rồi ép sống như thú cưng của hắn, ra mắt ở hình thức tự xuất bản vào tháng 2/2025. Sách nhanh chóng thu hút độc giả dòng kinh dị. Tập đoàn Hachette đã mua để phát hành tại Vương quốc Anh vào mùa thu năm ngoái, dự định ra mắt tại Mỹ vào mùa xuân năm nay, quảng bá đây là "tiểu thuyết kinh dị báo thù trần trụi, không khoan nhượng".

Sau khi sách phát hành tại Anh, ngày càng nhiều độc giả bày tỏ nghi ngờ tác giả đã sử dụng AI, đưa ra bằng chứng là các ẩn dụ vô nghĩa và lối diễn đạt lặp lại, kỳ lạ. Làn sóng cáo buộc dâng cao vào cuối tháng 1, nhưng Hachette vẫn giữ im lặng.

Đầu năm nay, Max Spero, nhà sáng lập kiêm giám đốc điều hành Pangram - một chương trình phát hiện AI - biết đến cáo buộc xoay quanh Shy Girl và quyết định kiểm tra toàn bộ tiểu thuyết này. Kết quả cho thấy cuốn sách có tới 78% nội dung do AI tạo ra. Spero đăng tải nghiên cứu của mình lên X vào tháng 1.

Bìa sách tiểu thuyết kinh dị Shy Girl phiên bản tự xuất bản (trái) và phiên bản phát hành ở Vương quốc Anh. Ảnh: Sonny Figueroa/NYT.

Tờ The Times cũng phân tích các đoạn trích từ tiểu thuyết bằng nhiều công cụ phát hiện AI và nhận thấy những dấu hiệu đặc trưng của văn bản do máy tạo ra lặp lại nhiều lần, như lỗ hổng logic, lạm dụng tính từ kịch tính và phụ thuộc quá mức vào quy tắc ba (một quy tắc viết lách cho rằng một cụm ba sự kiện hay nhân vật thì vừa đủ ngắn gọn và gây hài hước, do đó dễ nhớ hơn).

Sau khi biết đến cáo buộc về Shy Girl, chuyên gia tư vấn xuất bản Thad McIlroy đã đưa bản sách cho ba công cụ Pangram, GPTZero và Originality.ai kiểm tra. Cả ba đều kết luận văn bản khả năng cao do AI tạo ra một phần hoặc phần lớn. Pangram chỉ ra những cụm như "khoảnh khắc im lặng như con dao cắm vào ngực tôi, sắc bén và không lay chuyển" hay "tôi áp điện thoại lên môi, màn hình lạnh lẽo và không lay chuyển" mang dấu hiệu đặc trưng của chatbot.

Trả lời The New York Times, Hachette cho biết Nhà xuất bản Orbit của họ đã hủy kế hoạch phát hành cuốn sách tại Mỹ, đồng thời sẽ ngừng xuất bản tại Anh.

Theo phần giới thiệu, tác giả của Shy Girl, Mia Ballard, là một người viết thơ sống ở Bắc California. Cô gần như không hiện diện trên mạng xã hội và cũng không công khai phản hồi các cáo buộc. Trong một email gửi The Times vào 19/3, Ballard phủ nhận sử dụng AI viết sách, cho rằng một người quen mà cô thuê chỉnh sửa bản tự xuất bản đã sử dụng AI.

Người phát ngôn của Hachette cho biết quyết định hủy phát hành đưa ra sau quá trình phân tích kỹ lưỡng và kéo dài, nhấn mạnh rằng công ty đề cao sáng tạo của con người và yêu cầu tác giả xác nhận tác phẩm là nguyên gốc và khai báo việc sử dụng AI.

Vượt vòng kiểm định của nhà xuất bản lớn

Shy Girl dường như là tiểu thuyết thương mại đầu tiên từ một nhà xuất bản lớn bị thu hồi do bằng chứng liên quan đến AI. Sự việc cho thấy văn bản do AI tạo ra không chỉ xuất hiện trong ebook tự xuất bản giá rẻ tràn ngập Amazon, mà còn đang len lỏi vào cả hệ thống xuất bản truyền thống.

Việc Shy Girl có thể đi xa đến vậy trong quy trình biên tập, thậm chí phát hành tại Anh trước khi bị điều tra kỹ lưỡng, cho thấy ngành xuất bản đang thiếu chuẩn bị trước sự trỗi dậy của AI. Nó cũng báo hiệu một kỷ nguyên mới đầy bất định, khi cả biên tập viên lẫn độc giả phải tự hỏi liệu văn bản mình đang đọc là do con người hay máy móc viết ra.

Rất ít nhà xuất bản hoặc biên tập viên sẵn sàng phát biểu công khai về cách đối mặt với AI, bởi công nghệ này vẫn còn gây tranh cãi và mơ hồ về mặt đạo đức. Tuy vậy, một số lãnh đạo ngành xuất bản lo ngại rằng khó có thể ngăn chặn AI xâm nhập, nhất là khi công nghệ ngày càng tinh vi.

"Cũng giống với vấn đề đạo văn, bạn phải đặt niềm tin vào tác giả. Chúng tôi phải tin tưởng đối tác của mình", Morgan Entrekin, điều hành nhà xuất bản Grove Atlantic, chia sẻ.

Hiện tại, tác động rõ rệt nhất của AI đang diễn ra trong lĩnh vực tự xuất bản, mà nhiều tác giả nhận định đã “ngập lụt” nội dung AI kém chất lượng. Nhưng nhiều người trong ngành tin rằng sách do AI viết lọt qua khâu biên tập của các nhà xuất bản lớn chỉ là vấn đề thời gian. Công nghệ ngày càng phổ biến, còn nhà xuất bản truyền thống cũng thường xuyên mua lại sách tự xuất bản để tái phát hành. Thad McIlroy cho đây là lẽ tất yếu, và mọi chuyện đã bắt đầu.

Hiện gần như không thể đo lường chính xác có bao nhiêu văn bản do AI viết đang được xuất bản, nhưng có bằng chứng cho thấy công nghệ này đã góp phần làm bùng nổ số lượng sách. Năm ngoái, có hơn 3,5 triệu cuốn sách tự xuất bản, tăng từ 2,5 triệu vào năm 2024, theo dữ liệu của Bowker. Trong khi đó, các nhà xuất bản truyền thống phát hành chỉ hơn 642.000 đầu sách.

Tuhin Chakrabarty, giáo sư khoa học máy tính tại Đại học Stony Brook, đã dùng Pangram để kiểm tra hơn 14.000 tiểu thuyết tự xuất bản trên Amazon, chủ yếu trong giai đoạn 2024-2025. Kết quả cho thấy gần 20% số này có phần đáng kể do AI viết.

Ông Tuhin Chakrabarty, giáo sư khoa học máy tính tại Đại học Stony Brook, đánh giá công cụ Pangram nhận diện đúng các mẫu ngôn ngữ của chatbot. Ảnh: Columbia University.

Dù các công cụ phát hiện đôi khi nhầm lẫn, Chakrabarty cho biết ông tin Pangram đang nhận diện đúng các mẫu ngôn ngữ của chatbot. Công cụ này được thiết kế để phát hiện các cấu trúc ngôn ngữ thường thấy ở các mô hình ngôn ngữ lớn như ChatGPT hay Gemini, với tỷ lệ dự đoán sai khoảng 1/10.000, theo Spero. Pangram cũng có thể phát hiện thao tác cố tình chỉnh sửa để che vết AI.

Danh sách của Chakrabarty tập trung vào những cuốn được độc giả đón nhận, dựa trên số lượng đánh giá trên Goodreads và điểm trung bình. Trong bảng xếp hạng theo số lượt đánh giá cao nhất, Shy Girl thuộc số những cuốn nổi bật, với hơn 4.840 lượt đánh giá và điểm trung bình 3,5 sao. Tuy nhiên, bài đánh giá đầu tiên lại chấm 1 sao, nhận xét: "Tôi khá chắc đây là do ChatGPT viết".

Nhà văn Olivie Blake, từng viết lời giới thiệu khen ngợi Shy Girl, cho biết bà "thực sự thất vọng khi nghe rằng có thể sách có dùng AI", và khẳng định "AI không có chỗ trong nghệ thuật". Bà nói khi đọc sách đã tin đây là tác phẩm của con người và thấy nó "táo bạo, sáng tạo và độc đáo đến đáng sợ". Song bà cũng nói thêm rằng "Mia Ballard là nữ tác giả da màu ở vị thế rất dễ tổn thương trong ngành xuất bản, nên tôi không muốn vội vàng kết luận".

Ranh giới mong manh

Nhiều nhà xuất bản hiện không ghi rõ cấm sử dụng AI trong hợp đồng, mà dựa vào điều khoản yêu cầu tác phẩm phải "nguyên gốc". Trong khi đó, ngày nay nhiều người hiểu là ngầm cấm dùng AI để tạo nội dung văn bản hoặc hình ảnh.

Họ cũng dè chừng vì nội dung do AI tạo ra hiện chưa được bảo hộ bản quyền. Tuy nhiên, do AI được sử dụng rộng rãi trong nghiên cứu, lập dàn ý và các khâu khác, ranh giới sử dụng phù hợp vẫn rất mơ hồ. Nhiều người lo ngại điều này khiến các nhà xuất bản dễ bị lừa, hoặc gặp phải tác giả không nhận thức rằng việc họ dùng AI đã vượt qua giới hạn.

Một vấn đề khác là các nhà xuất bản không muốn cấm AI hoàn toàn. Biên tập viên hiểu rằng tác giả có thể dùng AI theo nhiều cách mà không trực tiếp để công cụ viết văn bản. Đồng thời, giới lãnh đạo cũng muốn nhân viên tận dụng công nghệ này trong tiếp thị, thu âm sách nói hay dịch thuật.

Thiếu vắng ranh giới rõ ràng đang gây ra sự mơ hồ: một tiểu thuyết gia có thể nhờ AI gợi ý tình tiết, đề xuất một kết thúc khác hay chỉnh sửa bản thảo mà vẫn coi đó là tác phẩm nguyên gốc không? Khi nào thì tác phẩm không còn là của con người?

Nghi ngờ lan rộng về việc tác giả dùng AI đặt nhà xuất bản vào thế khó. Nhiều người vẫn xem xuất bản truyền thống là "pháo đài cuối cùng" của văn chương nguyên bản do con người chọn lọc và biên tập. Nếu AI có thể tạo ra những tác phẩm hấp dẫn mà người đọc và biên tập viên không phân biệt được nguồn gốc, vai trò định hình gu thẩm mỹ của nhà xuất bản có thể bị xói mòn.

"Đây là vấn đề thực sự, và chúng ta cần các rào chắn" theo Mary Rasenberger, giám đốc điều hành Authors Guild. Bà cho rằng có những người tin chất lượng AI chưa đủ để cạnh tranh với con người, nhưng với các mô hình ngôn ngữ lớn (LLM) mới, điều đó không còn đúng.

Sử dụng AI trong viết lách vẫn gây chia rẽ sâu sắc. Một số xem đó là gian lận, đặc biệt khi độc giả không biết mình đang đọc nội dung do chatbot tạo ra. Số khác gọi đó là hành vi "ăn cắp", bởi lẽ nhiều AI được huấn luyện bằng tác phẩm có bản quyền mà không được cấp phép.

Seth Fishman, một đại diện văn học, cho biết phần lớn các tác giả mà ông đại diện phản đối dùng AI để viết. "Với tác giả, đây không chỉ là công nghệ, mà là vấn đề đạo đức. Họ cảm thấy tác phẩm của mình đã bị đánh cắp", ông nói.

Trước Shy Girl, trong ngành đã có tin đồn về những trường hợp suýt lọt lưới, nhà xuất bản kịp thời phát hiện việc dùng AI trước khi sách phát hành.

Có trường hợp, biên tập viên nghi ngờ vì một số đoạn văn quá nhạt nhẽo; tác giả sau đó thừa nhận đã dùng AI để chỉnh sửa. Một nhà xuất bản khác cũng hủy phát hành một cuốn sách vì phát hiện văn bản có AI hỗ trợ.

Hiện chưa có đồng thuận về cách kiểm soát nội dung AI. Một số đại diện và biên tập viên cho rằng cần quy định rõ ràng hơn để tránh nhầm lẫn hoặc gian lận.

Penguin Random House đã đưa ra hướng dẫn về việc sử dụng AI, trong khi HarperCollins, Simon & Schuster và Macmillan không chia sẻ chi tiết chính sách ngoài việc nhấn mạnh điều khoản "tính nguyên gốc".

Tuy nhiên, sự mơ hồ và kỳ thị xoay quanh AI có thể khiến tác giả càng ít minh bạch hơn. "Càng tránh né thảo luận, thì người ta càng dễ lạm dụng. Nỗi xấu hổ về AI đang gây hại nhiều hơn là giúp ích", Chakrabarty nói.

(*) Trong bài có sử dụng hình vẽ minh họa của George Wylesol.

Phong Khang

ChatGPT

Nguồn Znews: https://znews.vn/chat-vat-phan-biet-con-nguoi-voi-ai-post1636783.html

Local brand TP.HCM gây phẫn nộ vì 'làm biến dạng' sao quốc tế

29 phút

Samsung đưa tính năng tốt nhất của iPhone đến Galaxy S26

2 giờ

Tiếng Pháp trở thành ngôn ngữ được sử dụng nhiều thứ 4 trên thế giới

3 giờ

Tin nóng

Bác sỹ Ba Lan lập kỷ lục với ca phẫu thuật từ xa xuyên lục địa

6 giờ

Giới chuyên gia nhận định thành tựu này không chỉ nâng cao vị thế của Ba Lan trên bản đồ y học toàn cầu mà còn đóng góp vào việc thiết lập các tiêu chuẩn quốc tế cho phẫu thuật từ xa.

Sàn giao dịch ONUS không thể truy cập, loạt nhà đầu tư như 'ngồi trên lửa'

3 giờ

Từ chiều 20/3/2026 đến nay, sàn giao dịch ONUS không thể đăng nhập ứng dụng khiến hàng loạt nhà đầu tư như 'ngồi trên lửa', lo sợ mất toàn bộ tài sản đã lưu trữ trên sàn.

Vĩnh Long tiếp nhận hệ thống nội soi tiêu hóa do gia đình Giáo sư Đào Văn Long trao tặng

6 giờ

Sáng 22/3, Bệnh viện đa khoa Vĩnh Long tổ chức tiếp nhận hệ thống nội soi tiêu hóa Fujifilm do gia đình Giáo sư Đào Văn Long trao tặng. Dự lễ có Phó Giáo sư, Tiến sĩ, bác sĩ Nguyễn Duy Thắng, Chủ tịch Hội Tiêu hóa Hà Nội, Viện trưởng Viện Nghiên cứu và đào tạo tiêu hóa, Giám đốc Sở Y tế tỉnh Vĩnh Long Hồ Thị Thu Hằng.

Mỹ đối mặt khoảng trống chiến lược khi ISS sắp ngừng hoạt động

20 phút

Theo CNN, khi Trạm Vũ trụ Quốc tế (ISS) tiến gần đến thời điểm kết thúc hoạt động vào khoảng năm 2030, Mỹ có nguy cơ mất sự hiện diện liên tục ở quỹ đạo Trái Đất tầm thấp (LEO) nếu các trạm vũ trụ thương mại không kịp thay thế.

Chip mô phỏng não người giúp tiết kiệm tới 70% điện năng cho AI

6 giờ

Khám phá công nghệ memristor mới từ Đại học Cambridge, giúp giảm tiêu thụ năng lượng của phần cứng AI lên tới 70% nhờ thiết kế đột phá.

Người dùng đã dần thích nghi sau khi thí điểm xăng sinh học E10

7 giờ

Sau hơn nửa năm thí điểm xăng sinh học E10 RON95 tại một số đô thị, người dùng bước đầu ghi nhận phương tiện vận hành ổn định, không phát sinh vấn đề đáng kể. Tuy nhiên, chuyên gia khuyến nghị tiếp tục theo dõi kỹ thuật và bảo dưỡng định kỳ để đảm bảo hiệu quả lâu dài.

Tin mới

'Cánh đồng thông minh' đưa Trung Quốc tiến gần mục tiêu tự chủ lương thực

9 phút

Mô hình sản xuất lúa tự động tại Trung Quốc cho thấy khả năng tăng mạnh năng suất nhờ tự động hóa và trí tuệ nhân tạo (AI), trong bối cảnh nước này thúc đẩy chiến lược tự chủ lương thực đến năm 2032.

AI có thể làm trầm trọng các vấn đề tâm lý của người dùng

14 phút

Báo Financial Times (Anh) mới đây dẫn nghiên cứu từ Đại học Stanford (Mỹ) cảnh báo rằng trò chuyện với trí tuệ nhân tạo (AI) có thể làm trầm trọng thêm những tổn thương tâm lý sẵn có.

Giải mã RQ-180: Mắt thần tàng hình tuyệt mật của Mỹ lộ diện sau nhiệm vụ tại Iran

15 phút

UAV trinh sát chiến lược RQ-180 của Mỹ lần đầu lộ diện sau khi hạ cánh khẩn cấp tại Hy Lạp, hé lộ năng lực tàng hình vượt trội và vai trò then chốt trong giám sát không phận Iran.

Gia Lai: Gen Z lần đầu trải nghiệm triển lãm về phòng cháy, chữa cháy

18 phút

Ngày 22-3, sinh viên ngành Truyền thông đa phương tiện (Trường Đại học FPT Quy Nhơn) phối hợp với Phòng Cảnh sát PCCC & CNCH tổ chức triển lãm 'PHÒNG' tại trụ sở đơn vị. Sự kiện thuộc dự án Z0Fire (Zero Fire - Không còn cháy) nhằm giúp người trẻ tiếp cận kiến thức về PCCC.

Số hóa nông nghiệp Quảng Trị: Từ mô hình 'điểm' đến hệ sinh thái bền vững

37 phút

Tại Quảng Trị, chuyển đổi số (CĐS) nông nghiệp đã bước qua giai đoạn 'khẩu hiệu' để đi vào thực tiễn sinh động. Từ những vườn ươm điều khiển bằng smartphone đến các phiên livestream bán hàng trên tiktok, facebook… nông dân đang nỗ lực viết nên một chương mới cho nông sản địa phương. Tuy nhiên, để số hóa thực sự là 'đòn bẩy' thay vì những mô hình manh mún, bài toán về cơ sở dữ liệu và sự thay đổi tư duy đồng bộ vẫn là thách thức hàng đầu.

Huế đặt mục tiêu có 12.000 tên miền .vn vào năm 2030

39 phút

Cùng việc phấn đấu có ít nhất 50% doanh nghiệp sử dụng tên miền .vn vào năm 2030, Huế còn đặt mục tiêu đạt khoảng 12.000 tên miền .vn, tương đương 9–10 tên miền trên 1.000 dân...

Khám phá quy trình đào tạo sĩ quan Hải quân tương lai

1 giờ

Ngoài việc trực tiếp thực hành, thao tác trên các mô hình huấn luyện mô phỏng tàu chiến, ra-đa, vũ khí - trang bị kỹ thuật hiện đại, học viên Học viện Hải quân sẽ huấn luyện, thực hành, thực tập đường dài trên biển tại khu vực Đặc khu Trường Sa, nhà giàn DK1 và vùng biển quốc tế; đồng thời tham gia thực hiện nhiệm vụ đối ngoại quốc phòng bằng Tàu buồm 286 - Lê Quý Đôn.

Báo chí dẫn dắt nhận thức về năng lượng tái tạo

1 giờ

Những năm gần đây, chuyển dịch năng lượng đang trở thành yêu cầu cấp thiết của phát triển bền vững. Trong đó, báo chí ngày càng tham gia sâu hơn vào việc định hình nhận thức xã hội, kết nối chính sách với đời sống và góp phần thúc đẩy những lựa chọn phát triển theo hướng xanh, sạch và dài hạn.