Lập trình viên ép AI giao tiếp kiểu người tiền sử để tiết kiệm tiền

Để tiết kiệm chi phí sử dụng mô hình ngôn ngữ lớn, một lập trình viên đã buộc chatbot AI Claude giao tiếp bằng thứ ngôn ngữ cụt lủn của người tiền sử.

Dù phương pháp ép chatbot giao tiếp kiểu người tiền sử được quảng cáo là giúp cắt giảm lượng token tiêu thụ một cách đáng kể, nó lại đang phơi bày những rủi ro nghiêm trọng về chất lượng mã nguồn tạo ra, khiến giới chuyên gia công nghệ khuyến cáo người dùng không nên áp dụng vào thực tế.

Dù AI rất hiện đại nhưng vẫn có người muốn nó hoạt động kiểu người tiền sử

Dù AI rất hiện đại nhưng vẫn có người muốn nó hoạt động kiểu người tiền sử

Lách luật giới hạn token bằng câu lệnh tối giản kiểu người tiền sử

Mỗi lượt tương tác với các mô hình ngôn ngữ lớn đều tiêu tốn một lượng tài nguyên nhất định được gọi là token. Trong thế giới trí tuệ nhân tạo tạo sinh, token đóng vai trò là đơn vị điện toán nhỏ nhất. Tùy thuộc vào thiết kế của từng mô hình, một token có thể là một từ hoàn chỉnh, một âm tiết ngắn hoặc thậm chí chỉ là một mảnh từ vựng.

Đặc biệt đối với các công cụ AI chuyên hỗ trợ lập trình dựa trên tác tử AI, mức tiêu thụ token khổng lồ đang dần trở thành một minh chứng cho năng lực xử lý phức tạp. Đồng thời, cấu trúc tính phí này cũng trực tiếp mang lại nguồn doanh thu khổng lồ cho các nhà cung cấp dịch vụ công nghệ. Người dùng yêu cầu hệ thống phân tích và viết mã càng dài, chi phí họ phải gánh chịu càng phình to.

Ý tưởng ép mô hình Claude của hãng Anthropic nói chuyện giống như người hang động thời kỳ đồ đá bắt nguồn từ sự thất vọng sâu sắc của nhà phát triển Alexander Huso trước những giới hạn khắt khe của gói đăng ký Claude Pro. Việc liên tục chạm ngưỡng giới hạn token khiến luồng công việc của anh bị gián đoạn.

Anh chia sẻ rằng: Ý ban đầu của mình là buộc AI sử dụng thứ ngôn ngữ bập bẹ của trẻ nhỏ nhằm loại bỏ các từ ngữ dư thừa. Dù vậy, qua quá trình thử nghiệm, anh nhận thấy ngôn ngữ của người tiền sử lại hoạt động ổn định và mang lại cảm giác hài hước hơn rất nhiều. Lập trình viên này đã thiết kế các câu lệnh với cấu trúc tối giản đến mức cực đoan cho các tác vụ viết mã và kiểm tra bảo mật.

Thay vì giao tiếp bằng những câu văn hoàn chỉnh, anh ép Claude loại bỏ mọi từ ngữ lịch sự, từ nối và cấu trúc ngữ pháp phức tạp. Chatbot trò chuyện giờ đây chỉ được phép trả lời bằng các cụm từ cụt lủn, trực diện như: "Tại sao? Tôi không giải thích. Công cụ trước. Kết quả trước. Tôi dừng lại." Chế độ người tiền sử chính thức ra đời từ nỗ lực ép hệ thống vắt kiệt giá trị của từng token.

Sự suy giảm chất lượng và rủi ro ẩn giấu

Ngay sau khi những phát hiện độc đáo này được Huso đăng tải trên nền tảng Reddit, bài viết đã nhanh chóng lan truyền và thu hút sự chú ý của đông đảo cộng đồng công nghệ. Theo tính toán cá nhân của vị chuyên gia này, những người sử dụng hệ thống Claude có thể tiêu thụ ít hơn tới 75% lượng token nếu họ thiết lập thành công để chatbot này cư xử như một người tiền sử trong suốt phiên làm việc.

Tuy nhiên, đằng sau con số tiết kiệm đầy hứa hẹn đó lại là một sự đánh đổi cực kỳ rủi ro đối với người làm kỹ thuật. Chính bản thân Alexander Huso đã phải ghi nhận rằng chất lượng phản hồi và tư duy viết mã của phần mềm Claude Code đã suy giảm một cách nghiêm trọng khi chế độ người tiền sử được kích hoạt. Trong bài viết chia sẻ kinh nghiệm trên trang Business Insider, anh thẳng thắn thừa nhận bản thân sẽ không bao giờ tin tưởng giao cho chatbot này nhiệm vụ viết ra những đoạn mã nguồn tốt và an toàn cho các dự án thực tế.

Bên cạnh đó, các chuyên gia cũng đặt dấu hỏi lớn về tính khả thi của mức tiết kiệm 75% được rêu rao. Việc thiết lập và duy trì một hệ thống nhắc nhở để ép AI tuân thủ nghiêm ngặt vai diễn đặc biệt này cũng đòi hỏi việc tiêu tốn một lượng token hệ thống không hề nhỏ ở phần nền.

Trong phần bình luận trên bài đăng Reddit, rất nhiều người dùng đã bày tỏ thái độ hoài nghi sâu sắc trước tính hiệu quả thực sự của thủ thuật này. Một ý kiến phân tích kỹ thuật chỉ ra rằng nếu người dùng ép Claude nói chuyện như một người tiền sử, điều đó sẽ trực tiếp khiến toàn bộ hệ thống trở nên kém thông minh hơn.

Nguyên nhân cốt lõi nằm ở cơ chế dự đoán từ tiếp theo của mô hình ngôn ngữ. Khi hệ thống bị yêu cầu đảm nhận một vai trò có mức độ nhận thức thấp, vốn từ vựng và chiều sâu khái niệm của nó sẽ bị giới hạn cứng. Điều này ngăn cản trí tuệ nhân tạo sử dụng các thuật ngữ lập trình phức tạp và cấu trúc logic chặt chẽ, từ đó làm giảm chất lượng của những kết luận cuối cùng.

Mặc dù vấp phải nhiều ý kiến phản biện về mặt chuyên môn, thử nghiệm lạ lùng của Huso vẫn tạo ra một trào lưu lan truyền mạnh mẽ trong cộng đồng những người đam mê công nghệ. Một số nhà sáng tạo nội dung trên nền tảng YouTube đã nhanh chóng thực hiện các video đánh giá trải nghiệm chế độ này. Một lập trình viên trẻ tuổi đến từ Hà Lan cũng góp phần lan tỏa ý tưởng này đi xa hơn trên mạng xã hội.

Đối diện với việc ý tưởng của mình bị sao chép, Huso chia sẻ rằng trong thế giới mã nguồn mở, không hề có khái niệm đánh cắp ý tưởng. Anh cảm thấy bản thân nên tự hào vì sự sáng tạo của mình đã được cộng đồng công nhận và học hỏi. Nhờ sự chú ý từ sự việc này, trang cá nhân của anh trên nền tảng GitHub cũng thu hút thêm được một lượng lớn người theo dõi mới, mang lại lợi ích truyền thông tối đa cho cá nhân nhà phát triển này.

Bùi Tú

Nguồn Một Thế Giới: https://1thegioi.vn/lap-trinh-vien-ep-ai-giao-tiep-kieu-nguoi-tien-su-de-tiet-kiem-tien-252116.html