Google ra mắt thuật toán đột phá giúp AI giảm 6 lần bộ nhớ vận hành
Google vừa giới thiệu TurboQuant, một thuật toán nén bộ nhớ dựa trên trí tuệ nhân tạo đang thu hút sự chú ý lớn của giới công nghệ.

Ảnh minh họa.
Công nghệ này được thiết kế nhằm giảm đáng kể dung lượng “bộ nhớ làm việc” của các hệ thống AI, trong khi vẫn duy trì hiệu suất và độ chính xác.
Ngay sau khi công bố, cộng đồng mạng đã ví TurboQuant với “Người thổi sáo dẫn dụ” trong loạt phim Silicon Valley, do điểm tương đồng về khả năng nén dữ liệu vượt trội.
Theo Google Research, TurboQuant sử dụng kỹ thuật lượng tử hóa vector để xử lý các điểm nghẽn trong bộ nhớ đệm, cho phép AI lưu trữ nhiều thông tin hơn với không gian nhỏ hơn.
Công nghệ này có thể giảm nhu cầu bộ nhớ trong quá trình suy luận xuống ít nhất 6 lần, qua đó giúp tiết kiệm chi phí vận hành.
Bên cạnh đó, Google cũng phát triển 2 phương pháp hỗ trợ là PolarQuant và QJL nhằm tối ưu hóa quá trình nén. Dù vậy, TurboQuant hiện vẫn đang trong giai đoạn nghiên cứu và chưa được triển khai rộng rãi.
Các chuyên gia nhận định nếu được ứng dụng thực tế, công nghệ này có thể tạo ra bước tiến lớn về hiệu quả trong vận hành AI, dù chưa giải quyết triệt để nhu cầu bộ nhớ khổng lồ khi huấn luyện mô hình.













