AI dịch vài trang 'Sapiens' giống tới 80% bản do người dịch

AI luôn phải đối mặt với sự nghi ngờ về chất lượng dịch thuật, tuy nhiên, chúng đang dần tiến hóa để dịch các văn bản dung lượng lớn nhanh hơn.

 Ảnh minh họa. Nguồn: Leonardo.

Ảnh minh họa. Nguồn: Leonardo.

Trong một lần thử nghiệm khả năng dịch văn bản của trí tuệ nhân tạo, biên dịch viên tự do Nguyễn Hùng Anh nhận thấy độ chính xác của đoạn văn trong cuốn Sapiens của Yuval Noah Harari giống đến 80% so với một bản chuyển ngữ sang tiếng Việt trước đó.

Mỗi trang chỉ được AI dịch trong khoảng vài giây và tốc độ này khiến những người làm trong giới dịch thuật như Hùng Anh phải bất ngờ. Dù vậy, chất lượng của bản dịch, bản quyền vẫn là một vấn đề tạo nên cuộc tranh luận chưa có hồi kết.

Bản dịch của AI còn lỗ hổng

Khả năng dịch thuật của các công cụ trí tuệ nhân tạo (AI) đang gặp phải nhiều nghi ngờ từ phía người sử dụng, đặc biệt trong việc xử lý ngôn ngữ văn học và một số từ ngữ chuyên ngành. Tiêu Lân, một phiên dịch viên trẻ đang làm việc tại một công ty nước ngoài ở Việt Nam, cho biết AI có thể dịch khá tốt những lời thuyết minh trong các đoạn video.

Tuy nhiên, khi gặp phải những đoạn văn có phong cách ngôn ngữ văn học, AI lại bộc lộ rõ hạn chế. Phiên dịch viên Tiêu Lân nhấn mạnh rằng AI chưa thể nắm bắt được hết các ý tứ tinh tế trong văn chương, điều mà một dịch giả có kinh nghiệm mới thực hiện được.

Theo tác giả, dịch giả Lang Minh, AI hiện nay đưa ra bản dịch có chất lượng ổn định cho những văn bản không mang tính học thuật cao. Nhưng công nghệ này vẫn còn nhiều hạn chế trong việc dịch các tác phẩm phức tạp, đặc biệt cuốn sách, công trình trong nghiên cứu khoa học xã hội.

"Ví dụ đối với những tác phẩm kinh điển như của Plato, các nhà xuất bản khó có thể để máy móc dịch từ tiếng Hy Lạp sang bất kỳ ngôn ngữ nào, dù công nghệ có mạnh đến đâu. Đây là những công trình có độ phức tạp, đến người dịch còn gặp không ít khó khăn", tác giả, dịch giả Lang Minh chia sẻ.

 Các công cụ dịch phổ biến hiện nay. Ảnh: Gridly.

Các công cụ dịch phổ biến hiện nay. Ảnh: Gridly.

Khác với một số vấn đề với AI như trên, người dùng Vũ Minh Châu (giáo viên dạy tiếng Anh tại Hà Nội) chia sẻ các công cụ này rất hữu dụng trong việc dịch một số tài liệu ngắn, bài báo. Tuy nhiên, người dùng này cũng lưu ý rằng sản phẩm đầu ra của AI không thể chỉ là kết quả của một cú nhấn nút, mà đòi hỏi con người phải gia công lại để đạt được chất lượng mong muốn. Điều đó có nghĩa người sử dụng vẫn phải đầu tư công sức đáng kể để chỉnh sửa để nâng cao chất lượng diễn đạt trong bản dịch AI.

"Các câu có cấu trúc phức tạp, câu sử dụng những thủ pháp trong văn học, câu gắn vào những bối cảnh cụ thể... là những thứ AI chưa thể dịch tốt được", Minh Châu cho biết.

Ngoài ra, một trong những hạn chế lớn nhất của AI là khả năng tiếp cận với các ngôn ngữ ít phổ biến. Mặc dù AI đã có những bước tiến đáng kể trong việc dịch các ngôn ngữ thông dụng như tiếng Anh, Tây Ban Nha, Đức... nhưng khi phải làm việc với những ngôn ngữ ít được sử dụng hơn, nó thường gặp khó khăn và không thể cung cấp bản dịch chính xác.

Những yếu điểm này cho thấy dù AI có thể hỗ trợ phần nào trong công việc dịch, nó vẫn còn xa mới có thể thay thế hoàn toàn con người trong việc nắm bắt ý nghĩa sâu sắc và phong cách ngôn ngữ.

Máy móc đang thông minh hơn

Bên cạnh các nghi ngờ trên, AI vẫn có khả năng không ngừng tiến hóa. Nguyễn Quang Huy, một độc giả thường xuyên sử dụng các công cụ AI như ChatGPT và Gemini để dịch sách ngoại văn, chia sẻ rằng các công cụ này đã thể hiện khả năng dịch thuật khá ổn định, đặc biệt là với những sách chuyên ngành như lập trình.

Dù còn một số hạn chế trong việc dịch các tác phẩm văn học, như nhầm lẫn đại từ nhân xưng, nhưng độc giả Nguyễn Quang Huy cho rằng những hạn chế này có thể dần được khắc phục nhờ vào quá trình huấn luyện AI. Do đó, công nghệ này có tiềm năng khai thác lớn khi nó có thể tự động học hỏi từ các sai sót và cải thiện chất lượng dịch thuật.

Bên cạnh đó, không ít người dùng đã tự tạo ra những công cụ dịch thuật AI mới dựa trên nền tảng của các công ty công nghệ lớn như Facebook, Google, hay OpenAI. Theo khảo sát, đã có hơn 10 loại công cụ dịch khác nhau được phát triển bởi người dùng, và đặc biệt, chúng miễn phí.

Biên dịch viên Nguyễn Hùng Anh cũng từng thử nghiệm một công cụ AI miễn phí để dịch một đoạn văn trong cuốn sách Sapiens của Yuval Noah Harari. Anh kinh ngạc khi thấy kết quả dịch của AI khá giống văn bản do người dịch.

Điều này chứng tỏ AI đã học hỏi và tham khảo từ rất nhiều văn bản về các chủ đề như lịch sử, vật lý và khảo cổ học, giúp nâng cao độ chính xác của bản dịch.

 Biên dịch viên Phương Anh hiện làm việc trong lĩnh vực xuất nhập khẩu. Ảnh: Nhân vật cung cấp.

Biên dịch viên Phương Anh hiện làm việc trong lĩnh vực xuất nhập khẩu. Ảnh: Nhân vật cung cấp.

Phương Anh, một biên dịch viên trong lĩnh vực xuất nhập khẩu, nhận xét rằng các công cụ AI thường dịch tốt các văn bản đơn giản, nhưng gặp khó khăn với văn bản chuyên ngành, dẫn đến các bản dịch chưa sát nghĩa hoặc sai nghĩa. Sau vài lần điều chỉnh, AI đã tự động sửa chữa các lỗi trước đó, chứng minh khả năng máy học đáng kể của nó.

Phương Anh cũng cho biết sau khi cô hướng dẫn AI về nghĩa chính xác của từ "range hood" là “máy hút mùi” thay vì “mũ trùm đầu” AI đã sử dụng đúng từ này trong các đoạn văn tiếp theo, cải thiện rõ rệt độ chính xác và mạch lạc của bản dịch. Điều này khẳng định rằng AI không chỉ là một công cụ hỗ trợ, mà còn là một công cụ có khả năng phát triển và thích nghi, mang lại tiềm năng to lớn cho tương lai.

Những câu hỏi cần phải đặt ra

Việc sử dụng trí tuệ nhân tạo (AI) trong dịch thuật đang đặt ra nhiều vấn đề quan trọng, đặc biệt khi nhiều công cụ AI phổ biến hiện nay được phát triển và sử dụng rộng rãi từ các nguồn nước ngoài mà không ai biết rõ chúng được huấn luyện ra sao. Một số người dịch thuật và độc giả tại Việt Nam đã bày tỏ lo ngại về việc các công cụ này có thể được nạp dữ liệu từ các nguồn thiếu uy tín, mang tính chất không phù hợp với quan điểm văn hóa Việt Nam.

Vấn đề này càng trở nên phức tạp khi các công ty cung cấp dịch vụ AI hiện nay không công khai tài liệu huấn luyện của mình, khiến người dùng và nhà quản lý khó khăn hơn trong việc kiểm soát và đảm bảo rằng các công cụ này không gây hại đến văn hóa và xã hội.

 Giao diện làm việc với các công nghệ AI dịch thuật. Ảnh: Facebook.

Giao diện làm việc với các công nghệ AI dịch thuật. Ảnh: Facebook.

Một câu hỏi khác đặt ra là liệu AI có được huấn luyện bằng cách truy cập dữ liệu trái phép hay không, liên quan đến vấn đề bản quyền. Nếu AI sử dụng các dữ liệu mà không có sự đồng ý của chủ sở hữu, thì nó không chỉ vi phạm pháp luật mà còn đẩy ngành xuất bản vào tình trạng rủi ro về bản quyền. Việc sử dụng dữ liệu không hợp pháp để huấn luyện AI có thể dẫn đến hậu quả nghiêm trọng, đặc biệt trong một ngành yêu cầu độ chính xác và tôn trọng bản quyền cao như dịch thuật.

Cuối cùng, câu hỏi lớn đặt ra là liệu AI có thể trở thành một phần chính thức của ngành xuất bản hay không? Dù AI đã chứng minh được tính hữu dụng trong nhiều lĩnh vực, nhưng để nó có thể được áp dụng rộng rãi trong xuất bản, cần có những hành lang pháp lý và quy định rõ ràng.

Cần xem xét cẩn thận việc xây dựng các quy định và hướng dẫn để đảm bảo rằng AI được sử dụng một cách hợp pháp, có đạo đức và không ảnh hưởng xấu đến ngành xuất bản truyền thống. Điều này đòi hỏi một tầm nhìn dài hạn và chiến lược hợp lý, để AI không chỉ là một công cụ hỗ trợ mà còn là một phần của sự phát triển bền vững của ngành dịch thuật và xuất bản.

Đức Huy

Nguồn Znews: https://znews.vn/cong-nghe-ai-dang-tien-hoa-dich-gia-phai-tra-loi-cau-hoi-gi-post1490930.html