Google nói dối

2.500 trang tài liệu nội bộ từ Google đã tiết lộ cách thức hoạt động của Tìm kiếm, thế lực quyền lực nhất trên Internet. Một số thông tin mâu thuẫn với các tuyên bố công khai.

 Một số thông tin trong tài liệu mâu thuẫn với các tuyên bố công khai của gã khổng lồ công nghệ. Ảnh: Unsplash.

Một số thông tin trong tài liệu mâu thuẫn với các tuyên bố công khai của gã khổng lồ công nghệ. Ảnh: Unsplash.

Là một trong những hệ thống quan trọng nhất trên Internet, thuật toán tìm kiếm của Google sẽ quyết định trang web nào được phép tồn tại hay phải chết đi. Thậm chí, Google cũng là kẻ quyết định nội dung trên website là gì.

Từ lâu, cách Google xếp hạng các trang web vẫn luôn là một điều bí ẩn. Nó được các nhà báo, nhà nghiên cứu và những người làm việc trong lĩnh vực này liên tục đặt câu hỏi.

Nhưng mới đây, tất cả đã được đưa ra ánh sáng khi một bộ tài liệu nội bộ dài hàng nghìn trang về công cụ tìm kiếm của Google bị rò rỉ. Nó tiết lộ những thông tin chưa từng có về cách thức hoạt động của Google Tìm kiếm, đồng thời cho thấy sự gian dối của Google suốt nhiều năm. Google vẫn chưa đưa ra bất kỳ phản hồi nào về tính hợp pháp của các tài liệu này.

Lý do khiến kết quả tìm kiếm Google ngày càng nhiều “rác”

Chuyên gia SEO Rand Fishkin và Mike King cho biết một nguồn tin giấu tên đã chia sẻ 2.500 trang tài liệu với anh. Người này hy vọng rằng vụ rò rỉ sẽ bóc trần những “lời nói dối” của Google về cách hoạt động của thuật toán tìm kiếm.

Với lượng thông tin dày đặc và nặng tính kỹ thuật, tài liệu tiết lộ những loại dữ liệu được Google thu thập từ các trang web, người dùng, đồng thời gợi ý một số nội dung được Google yêu thích.

 Tài liệu 2.500 trang đã bóc trần lời nói dối của Google về cách hãng xếp hạng tìm kiếm. Ảnh: GZN.

Tài liệu 2.500 trang đã bóc trần lời nói dối của Google về cách hãng xếp hạng tìm kiếm. Ảnh: GZN.

Các tài liệu bị rò rỉ còn đề cập đến loại dữ liệu nào sẽ được Google thu thập và sử dụng, những trang web nào Google đề xuất mạnh, cách Google xử lý các trang web nhỏ, lẻ… Theo 2 chuyên gia SEO Fishkin và King, một số thông tin trong tài liệu mâu thuẫn với các tuyên bố công khai của gã khổng lồ công nghệ.

King viết: “Dùng từ ‘dối trá’ thì có vẻ hà khắc, nhưng đó là từ chính xác duy nhất có thể sử dụng ở đây. Tôi không đổ lỗi cho các phát ngôn viên của Google khi họ bảo vệ thông tin bí mật của tập đoàn, nhưng vẫn không hài lòng khi hãng luôn cố làm mất uy tín của những người làm trong ngành marketing, công nghệ và báo chí”.

Google đã không trả lời các yêu cầu bình luận của The Verge về các tài liệu. Nói với The Verge, Fishkin cho biết công ty không phủ nhận tính xác thực của vụ rò rỉ, nhưng một nhân viên đã yêu cầu anh thay đổi một số từ ngữ trong bài đăng.

Thuật toán tìm kiếm bí mật của Google đã tạo ra cả một thị trường marketing. Họ là những người luôn tuân thủ chặt chẽ khuyến cáo của Google và áp dụng cho hàng triệu công ty trên khắp thế giới.

Các chiến thuật marketing tinh vi đã dẫn đến một hậu quả - kết quả của Google Tìm kiếm đang trở nên tồi tệ hơn, chứa đầy những nội dung rác rưởi chỉ để trang web được xuất hiện ở vị trí cao. Đáp lại các bài viết chỉ trích chiến thuật SEO trên Google, đại diện hãng thường có cách biện hộ quen thuộc: “Đó không phải những điều Google khuyến khích họ làm”.

 Một ví dụ cho thấy dữ liệu của Google Chrome được sử dụng cho Tìm kiếm.

Một ví dụ cho thấy dữ liệu của Google Chrome được sử dụng cho Tìm kiếm.

Tuy nhiên, một số chi tiết trong tài liệu bị rò rỉ lại chỉ ra những phát ngôn này của Google có phần dối trá.

Một ví dụ điển hình được Fishkin và King trích dẫn liên quan đến việc dữ liệu từ Google Chrome được hãng sử dụng để xếp hạng nội dung. Đại diện của Google đã nhiều lần khẳng định họ không sử dụng dữ liệu Chrome để xếp hạng các trang.

Nhưng trong tài liệu nội bộ, Chrome luôn được đề cập cụ thể khi phân tích cách các trang web xuất hiện trong Tìm kiếm. Theo các tài liệu, các liên kết xuất hiện bên dưới URL chính của vogue.com được tạo ra một phần bằng dữ liệu Chrome.

Bí mật của Google được đưa ra ánh sáng

Một câu hỏi khác được đặt ra là vai trò của E-E-A-T trong xếp hạng là gì. E-E-A-T là viết tắt của kinh nghiệm (experience), kiến thức chuyên môn (expertise), tính xác thực (authoritativeness) và độ tin cậy (trustworthiness).

Đây là thước đo của Google để đánh giá chất lượng kết quả tìm kiếm. Trước đây, đại diện của Google từng tuyên bố E-E-A-T không phải là yếu tố xếp hạng. Fishkin cho biết ông cũng không tìm thấy nhiều tài liệu đề cập đến tên E-E-A-T.

Tuy nhiên, King đã trình bày chi tiết cách Google thu thập dữ liệu tác giả từ website. Hãng cũng có cách riêng để biết một cái tên xuất hiện trên trang có phải là tác giả hay không. Cách thức này “chủ yếu được phát triển và tùy chỉnh cho các bài báo, nhưng cũng được áp dụng cho các nội dung khác như bài báo khoa học”, trích tài liệu rò rỉ.

Trong khi đó, Google trước đây đã nhấn mạnh rằng thông tin tên tác giả là điều mà chủ trang web nên làm cho độc giả, chứ không phải Google vì nó không ảnh hưởng đến xếp hạng.

 Google thu thập dữ liệu tác giả trên website. Ảnh: Flickr.

Google thu thập dữ liệu tác giả trên website. Ảnh: Flickr.

Theo The Verge, mặc dù không tấn công trực diện vào Google, những tài liệu bị rò rỉ đã tiết lộ về hệ thống bí mật của gã khổng lồ công nghệ. Vụ kiện chống độc quyền của chính phủ Mỹ chống lại Google - xoay quanh công cụ Tìm kiếm - cũng đã dẫn đến việc tài liệu nội bộ được đưa ra ánh sáng.

Việc Google giữ bí mật về cách hoạt động của Tìm kiếm đã dẫn đến việc các trang web ngày càng trông giống hệt nhau. Lý do là các nhà marketing SEO phải cố lách luật Google, bằng cách dựa trên những gợi ý mà công ty đã đưa ra.

“Trước đây, nhiều người có tiếng trong lĩnh vực tìm kiếm và các nhà phát hành web nổi tiếng đều nghe theo, truyền bá các phát ngôn của Google mà chẳng dám phản bác. Họ viết những dòng tiêu đề như ‘Google nói XYZ là đúng’ thay vì ‘Google tuyên bố XYZ nhưng bằng chứng cho thấy điều ngược lại’. Tôi muốn điều này sẽ thay đổi”, Fishkin chỉ trích.

Thúy Liên

Nguồn Znews: https://znews.vn/google-noi-doi-ve-thuat-toan-tim-kiem-post1478193.html