Ngành công nghệ đàm phán mua nội dung tin tức để đào tạo AI

Chuyên trang Sài Gòn Tiếp Thị - Tạp chí Kinh tế Sài Gòn

19/6/2023 Gốc

Các công ty công nghệ lớn nhất thế giới đang đàm phán với các tập đoàn truyền thông hàng đầu để đạt được các thỏa thuận sử dụng nội dung tin tức phục vụ hoạt động đào tạo công nghệ trí tuệ nhân tạo (AI).

Tin tức báo chí là một trong những nguồn dữ liệu để đào tạo các chatbot như ChatGPT của OpenAI. Ảnh: Guardian

Financial Times dẫn các nguồn thạo tin cho biết, trong những tháng gần đây, OpenAI, Google, Microsoft và Adobe đã gặp gỡ các lãnh đạo của tập đoàn truyền thông tin tức để thảo luận về vấn đề bản quyền xung quanh các sản phẩm AI của họ như chatbot tạo văn bản và hình ảnh. Các nhà xuất bản tin tức như News Corp, Axel Springer, The New York Times và The Guardian đã tham gia cuộc thảo luận với một số công ty công nghệ nói trên.

Cuộc thảo luận, vẫn còn ở giai đoạn đầu, có thể dẫn đến thỏa thuận, trong đó, các tập đoàn công nghệ trả cho các tổ chức truyền thông một khoản phí để được phép sử dụng cho nội dung của họ cho mục đích phát triển công nghệ làm nền tảng cho các chatbot như ChatGPT của OpenAI và Bard của Google.

Các cuộc đàm phán diễn ra giữa lúc các tập đoàn truyền thông bày tỏ lo ngại về mối đe dọa trước sự trỗi dậy của AI. Họ phản đối việc OpenAI và Google sử dụng nội dung của họ khi chưa có thỏa thuận. Một số công ty AI như Stability AI và OpenAI đang đối mặt với hành động pháp lý từ các nghệ sĩ, công ty ảnh và lập trình viên, những bên cáo buộc hai công ty vi phạm hợp đồng và bản quyền.

Hồi tháng 5, phát biểu tại hội nghị của Hiệp hội Truyền thông tin tức quốc tế (INMA) ở New Yok, CEO của News Corp, Robert Thomson, nói: “Bản quyền sở hữu trí tuệ tập thể của phương tiện truyền thông đang bị đe dọa và chúng ta nên tranh luận gay gắt để được bồi thường”.

Ông nói thêm rằng AI được “thiết kế để người đọc sẽ không bao giờ cần truy cập một trang web báo chí, do đó làm suy yếu nghiêm trọng hoạt động báo chí”.

Các lãnh đạo ngành truyền thông muốn tránh những sai lầm vào thời đại internet còn sơ khai, khi nhiều nhà xuất bản cung cấp các bài báo trực tuyến miễn phí để cuối cùng làm suy yếu mô hình kinh doanh của họ. Các tập đoàn công nghệ như Google và Facebook đã tiếp cận các bài báo đó để giúp xây dựng mảng kinh doanh quảng cáo trực tuyến trị giá hàng tỉ đô la.

Khi mức độ phổ cập của AI tạo sinh ngày càng tăng, mối lo ngại của ngành công nghiệp tin tức cũng tăng lên, do khả năng của công nghệ này trong việc tạo ra những đoạn văn bản đầy sức thuyết phục, giống như năng lực của con người.

Một số cuộc thảo luận hiện nay tìm cách thiết lập một phương pháp định giá cho nội dung tin tức được sử dụng làm dữ liệu đào tạo cho các mô hình AI. Theo một lãnh đạo ngành truyền thông, các nhà xuất bản đang đề xuất mức phí sử dụng nội dung tin tức của họ từ 5-20 triệu đô la Mỹ/ năm.

Mathias Döpfner, CEO của Axel Springer, chủ sở hữu của hãng truyền thông Politico (Mỹ), nhật báo Bild (Đức)…, đã gặp gỡ đại diện của một số công ty AI hàng đầu như Google, Microsoft và OpenAI. Ông cho biết lựa chọn đầu tiên của ông là tạo ra một mô hình “định lượng,” tương tự như mô hình mà ngành công nghiệp âm nhạc đang áp dụng đài phát thanh, hộp đêm, dịch vụ phát sóng trực tuyến để xác định mức phí trả cho các hãng thu âm mỗi khi một bản nhạc được họ sử dụng.

Điều này đòi hỏi các công ty AI phải tiết lộ việc sử dụng nội dung truyền thông của họ, điều mà họ hiện không làm.

Döpfner cho rằng một thỏa thuận trả phí hàng năm về việc sử dụng không giới hạn nội dung của một công ty truyền thông sẽ là “phương án tốt thứ hai”.

Google đã dẫn đầu các cuộc đàm phán với các cơ quan báo chí của Anh bao gồm Guardian và NewsUK. Công ty thuộc sở hữu của tập đoàn Alphabet vốn đã thiết lập quan hệ đối tác lâu dài với nhiều tổ chức truyền thông để sử dụng dữ liệu từ nội dung báo chí nhằm đảm bảo nội dung đó được tối ưu hóa để xuất hiện trong công cụ tìm kiếm.

Google cũng đã sử dụng dữ liệu báo chí để đào tạo các mô hình ngôn ngữ lớn của mình. Lãnh đạo của một tập đoàn truyền thông tiết lộ, Google đã chấp nhận nguyên tắc rằng cần phải trả tiền để sử dụng dữ liệu này nhưng các bên chưa xác định được con số cụ thể.

Google thừa nhận đang tiếp tục thảo luận với các tổ chức báo chí lớn nhỏ ở Mỹ, Anh và châu Âu.

Google đã đề xuất cung cấp cho các nhà xuất bản nhiều “lựa chọn và quyền kiểm soát” hơn đối với việc nội dung của họ có trở thành một phần của bộ dữ liệu đào tạo cho AI hay không. Điều này tương tự như cách Google cho phép các trang web từ chối cho phép sử dụng nội dung của họ trong kết quả tìm kiếm.

Các nguồn tin cho biết kể từ khi ra mắt ChatGPT vào tháng 11, Sam Altman, CEO của OpenAI đã gặp gỡ lãnh đạo của News Corp và The New York Times.

Theo các nhà lãnh đạo ngành xuất bản, việc phát triển một mô hình tài chính cho việc sử dụng nội dung tin tức để đào tạo AI sẽ vô cùng khó khăn. Các lãnh đạo của một nhà xuất bản lớn ở Mỹ cho biết, ngành công nghiệp tin tức đang tìm cách hồi tố vì các công ty công nghệ đã tung ra những sản phẩm AI có sử dụng nội dung báo chí mà không hỏi ý kiến họ.

Nhà phân tích truyền thông Claire Enders nhận định các cuộc đàm phán hiện tại rất phức tạp. Bà nói thêm, vì mỗi tổ chức có cách tiếp cận riêng nên một thỏa thuận thương mại thống nhất cho các tập đoàn truyền thông là khó xảy ra và có thể phản tác dụng.

Bà cho rằng các chatbot sẽ không thể trở thành công cụ đáng tin cậy nếu chúng được đào tạo dựa trên những văn bản mở, dễ tiếp cận với nhiều nội dung không phù hợp như phân biệt chủng tộc.

Döpfner của Axel Springer nói: “Các công ty AI biết rằng sắp có quy định quản lý và họ lo lắng về điều đó. Tất cả các bên đều có lợi khi đưa ra giải pháp cho một hệ sinh thái lành mạnh. Nếu không có động lực để tạo ra tài sản trí tuệ, thì sẽ không có dữ liệu để thu thập từ internet. Và trí tuệ nhận tạo sẽ trở thành sự ngu xuẩn nhân tạo”.

Khánh Lan

Theo Kinh tế Sài Gòn Online

Nguồn Sài Gòn Tiếp Thị: https://www.sgtiepthi.vn/nganh-cong-nghe-dam-phan-mua-noi-dung-tin-tuc-de-dao-tao-ai/