ChatGPT siêu thông minh nhưng vì sao chưa thể thay thế công cụ tìm kiếm Google?
ChatGPT được xem là chương trình thể hiện sự ưu việt của trí tuệ nhân tạo nhưng nó vẫn chưa đủ khả năng để soán ngôi Google trong tương lai gần.
Trong một bài phân tích mới đây trên MOZ, tiến sĩ Peter J. Meyers, chuyên gia marketing của công ty tư vấn giải pháp SEO – MOZ nhận định, ChatGPT của OpenAI không phải là công cụ tìm kiếm, nó là chatbot trí tuệ nhân tạo sử dụng xử lý ngôn ngữ tự nhiên để hiểu và phản hồi yêu cầu của người dùng.
So với công cụ tìm kiếm của Google, ChatGPT mang đến cho người dùng những trải nghiệm lẫn kiến thức mới khi nó có thể trả lời và giải quyết vô số vấn đề khác nhau.
Cái tên ChatGPT là viết tắt của Chat Generative Pre-training Transformer, ám chỉ nó là một hệ thống học sâu có thể tự tạo văn bản dựa vào việc dự đoán các mô hình ngôn ngữ sau khi được huấn luyện với khối lượng rất lớn tài liệu.
Chuyên gia Meyers khá ấn tượng bởi những gì ChatGPT có thể làm được, thậm chí nó có thể nói cho bạn biết ChatGPT là gì. ChatGPT tự giải thích chính nó. Khi được hỏi "Bạn giải thích ChatGPT cho một đứa trẻ 5 tuổi thế nào?", chatbot này trả lời: "ChatGPT giống như một người bạn robot, có thể nói chuyện và trả lời câu hỏi của bạn".
Vậy điều gì khiến giới công nghệ đưa ra nhận định ChatGPT đe dọa đến “ngôi vương” của Google trên mạng internet?
Có ý kiến cho rằng năng lực của ChatGPT khiến nhiều người lo ngại rằng, nó có thể cách mạng hóa việc tiếp cận kiến thức và thậm chí thay thế Google trong lĩnh vực tìm kiếm, như cách công cụ này tạo ra cuộc cách mạng hơn 2 thập kỷ trước.
Đầu tiên, cần hiểu rằng ChatGPT không phải công cụ tìm kiếm như Google. Nó là một chatbot trí tuệ nhân tạo sử dụng quá trình xử lý ngôn ngữ tự nhiên để hiểu câu hỏi và trả lời người dùng, theo chính nó giải thích.
Những ngày đầu mới ra mắt, Google chưa thông minh như bây giờ. Thời điểm đó, nó chỉ có thể trả về kết quả tối ưu cho những truy vấn đơn giản và ngắn gọn. Có 3 dạng truy vấn chính, là truy vấn có định hướng (khi bạn biết rõ mình cần tìm gì), truy vấn thông tin (câu hỏi) và truy vấn giao dịch (để mua hàng).
Chẳng hạn, nếu muốn mua laptop mới, bạn có thể gõ "laptop" hoặc "laptop cấu hình mạnh" để Google hiển thị các kết quả trùng khớp. Qua thời gian, khi Google trở nên thông minh hơn, người dùng cũng nhận ra họ có thể bắt đầu hỏi những câu khó hơn. Hướng phát triển tự nhiên của Google là tối ưu thuật toán trả lời truy vấn dạng câu hỏi và tìm kiếm thông tin.
Đến thời điểm này, khi bạn đặt câu hỏi cho Google, nó sẽ đưa ra một thẻ thông tin trả lời, được trích từ một nguồn nào đó mà Google nhìn nhận là trùng khớp và uy tín. Chẳng hạn, khi hỏi "Google tìm kiếm hoạt động thế nào?", câu trả lời của Google là: "Thu thập dữ liệu: Google tìm kiếm web bằng các chương trình tự động gọi là trình thu thập web, tìm kiếm các trang mới hoặc đã được cập nhật. Google lưu trữ những địa chỉ trang web và URL trong một danh sách lớn để tra cứu sau...".
Rõ ràng là câu trả lời ngắn gọn của Google tìm kiếm về chính mình không giúp người đọc hiểu được nhiều vì nó chỉ là đoạn trích ngắn trong một tài liệu dài của công ty. Đây cũng là cách các câu hỏi khác được trả lời, phần lớn bằng trích dẫn trùng khớp.
Đây chính là điểm khiến Google lo lắng. Cùng với câu hỏi trên, ChatGPT trả lời: "Google tìm kiếm hoạt động bằng cách thu thập dữ liệu trang web và lập chỉ mục các trang web. Khi người dùng tìm kiếm thứ gì đó, Google sẽ xem qua chỉ mục của nó và trả về kết quả phù hợp nhất. Nó sử dụng kết hợp các thuật toán và các kỹ thuật khác để xác định mức độ liên quan của kết quả. Các thuật toán này tính đến các yếu tố như từ được sử dụng trong truy vấn, độ mới của nội dung, mức độ phổ biến của trang web và vị trí của người dùng".
Có thể thấy câu trả lời do ChatGPT tự soạn và không trích dẫn ở đâu hết. Cách tiếp cận này mang nhiều ưu điểm bởi có những câu hỏi không thể được trả lời bằng vài dòng ngắn gọn, thậm chí còn chưa được trả lời sẵn trên web mà cần "tư duy" để đưa câu trả lời đúng.
Nhưng đó là vẻ ngoài. Kiểu trả lời của Google dù chưa thỏa mãn được người dùng ngay nhưng có một lợi thế quan trọng là nguồn thông tin để người dùng lập tức truy cập, và tìm hiểu sâu hơn cũng như tự khám phá xem nguồn đó có uy tín hay không.
Ngoài các chủ đề học thuật, ngay cả những câu hỏi kiến thức thông thường cũng cần trích nguồn để xác minh. Với ChatGPT, đó có thể không phải một công việc đơn giản khi kho dữ liệu của nó được thu thập từ vô số trang web, câu trả lời và tự tổng hợp lại thành ngôn ngữ tự nhiên.
Việc không trích nguồn cũng sẽ dẫn tới cuộc tranh cãi dài hơi hơn về vấn nạn đạo văn, tương tự như cách mà các công cụ AI sử dụng tác phẩm nghệ thuật có sẵn của các nghệ sĩ con người để tạo ra sản phẩm mới.
Vấn đề thứ hai nằm ở chỗ ChatGPT chưa có khả năng tư duy phê phán và phản biện mạnh. Người dùng liên tục thách thức nó bằng những câu hỏi và mệnh đề "trái khoáy" rồi sớm nhận ra nó không thực sự tự tin vào kiến thức mình cung cấp, kể cả khi đáp án là không cần tranh cãi.
Một ví dụ như cách Meyers đặt ra một câu hỏi “bẫy” cho ChatGPT: “Bản hit The Fast and the Furious: Tokyo Drift năm 1976 của Mozart là về cái gì?”
ChatGPT trả lời là: “Bản hit năm 1976 của Mozart "The Fast and the Furious: Tokyo Drift" không liên quan đến bộ phim cùng tên năm 2006. Nó là một bản nhạc cụ ghi lại năng lượng điên cuồng của đường phố Tokyo vào ban đêm. Bài hát được xây dựng dựa trên một dòng piano hấp dẫn, đảo phách và nhịp điệu sôi động, lạc quan".
Thực tế chẳng có bản nhạc nào tên như vậy, cũng chẳng có nhà soạn nhạc Mozart nào sáng tác ở thời điểm 1976. Đối mặt với những câu hỏi trái khoáy dạng này, một công cụ tìm kiếm kiểu Google sẽ thường "bó tay" hoặc cố gắng đưa ra các kết quả trùng khớp từ khóa chứ không nhất nhất trả lời như thể mình biết tuốt.
Nhiều người nhận định có thể một ngày nào đó ChatGPT thay thế báo chí, nhưng với khả năng nhận thức hiện thực như hiện tại thì có lẽ viễn cảnh đó còn xa. Năng lực học sâu vượt trội cho công cụ này khả năng tổng hợp thông tin đỉnh cao, nhưng chỉ cần câu hỏi lắt léo một chút là các điểm yếu tư duy "máy móc" theo nghĩa đen sẽ hiện ra.
Thứ ba, công cụ này vẫn đang ở trạng thái beta, nó vẫn còn một số khiếm khuyết mà bản thân Google với nguồn lực dồi dào và khối lượng dữ liệu khổng lồ còn e ngại, chẳng hạn như khả năng bị tổn thương trước thành kiến.
Mặc dù luôn cố gắng tỏ ra trung lập trong các câu trả lời và đã khôn khéo hơn khi đối mặt các câu hỏi mang tính đạo đức, triết lý, nguồn dữ liệu chính mà chatbot này thu thập để hoàn thiện chính nó vẫn là những dữ liệu, thông tin nó được tiếp cận.
Nói cách khác, như chuyên gia về đạo đức và kỹ thuật số Lukas Stuber ở Zurich chỉ ra: "Về cơ bản, ChatGPT là con vẹt cực kỳ phát triển. Nó nói như vẹt những gì có trên internet".
Nhưng kể cả như vậy thì những hạn chế này là bởi thời điểm hiện tại ChatGPT đang chập chững. Với nguồn lực đầu tư từ Microsoft (nhiều tỷ USD) vào OpenAI, Google cũng đang lo lắng chứ không thể ung dung tự tại. Một điều chắc chắn là trong năm 2023 và những năm tới đây, chúng ta có thể trông thấy nhiều ngọn sóng mới trong công nghệ truy vấn, và ChatGPT sẽ không phải mối lo duy nhất của Google.