Cơn sốt AI đang làm cạn kiệt năng lực tính toán
Cơn sốt trí tuệ nhân tạo đang nhanh chóng làm cạn kiệt nguồn cung của một tài nguyên mà các nhà phát triển không thể thiếu: Năng lực tính toán.
Tình trạng thiếu hụt này đã gây lo ngại cho người dùng chuyên sâu, buộc các công ty hủy bỏ sản phẩm và làm gia tăng sự cố gián đoạn.

AI đang phát triển nhanh hơn khả năng xây dựng hạ tầng để vận hành nó. Nguồn: favtutor
Đây là tín hiệu cảnh báo cho làn sóng AI, khi những hạn chế về hạ tầng có thể kìm hãm các công cụ mạnh mẽ đúng vào thời điểm ngày càng nhiều người phụ thuộc vào chúng để nâng cao năng suất. Nói đơn giản, AI đang phát triển nhanh hơn khả năng xây dựng hạ tầng để vận hành nó.
Trong vài tháng qua, nhu cầu đối với AI “tự hành” (agentic AI) đã bùng nổ (các công cụ có thể tự thực hiện nhiều bước công việc liên tiếp mà người dung không cần can thiệp liên tục). Các công ty đang chạy đua để đảm bảo đủ năng lực tính toán cho lượng khách hàng ngày càng tăng, trong khi mức sử dụng trên mỗi người dùng cũng tăng mạnh.
“Người ta nói nhiều về dầu mỏ, nhưng tôi cho rằng thứ thế giới thực sự thiếu là token,” Ben Pouladian, một kỹ sư và nhà đầu tư công nghệ tại Los Angeles, nhận định. Token là đơn vị đo mức tiêu thụ tính toán — càng dùng AI nhiều, lượng token càng lớn. “AI giờ không còn chỉ là chatbot đơn giản. Nó đang điều phối công việc và ngày càng thông minh hơn,” ông nói.
Tình trạng này phản ánh một bài toán quen thuộc trong các làn sóng công nghệ trước đây, từ đường sắt thế kỷ 19 đến bùng nổ viễn thông và internet đầu những năm 2000: nhu cầu tăng nhanh hơn khả năng mở rộng hạ tầng. Trong lịch sử, tăng giá thường là cách để xử lý thiếu hụt nguồn cung, nhưng điều này có thể rủi ro với các công ty AI đang cạnh tranh gay gắt để thu hút người dùng.
Giá thuê GPU — các vi mạch được xem là “động cơ” của hệ thống AI — đã tăng mạnh kể từ cuối năm ngoái. Anthropic, nhà phát triển chatbot Claude, gần đây liên tục gặp sự cố gián đoạn. Công ty đã bắt đầu giới hạn mức sử dụng trong giờ cao điểm, nhưng nhiều người dùng cho biết họ nhanh chóng chạm ngưỡng.
OpenAI đã hủy kế hoạch triển khai ứng dụng tạo video Sora, một phần để giải phóng năng lực tính toán cho các sản phẩm lập trình và doanh nghiệp, theo The Wall Street Journal.
Lượng token sử dụng trong API của OpenAI — nền tảng mà khách hàng doanh nghiệp truy cập phần mềm — đã tăng từ 6 tỷ mỗi phút vào tháng 10 lên 15 tỷ mỗi phút vào cuối tháng 3, cho thấy mức sử dụng tăng vọt chỉ trong vài tháng.
“Chúng tôi dành rất nhiều thời gian để tìm bất kỳ phần năng lực tính toán còn dư nào,” Sarah Friar, Giám đốc tài chính của OpenAI, cho biết. “Chúng tôi phải đưa ra những đánh đổi rất khó khăn vì không đủ năng lực.”
Cuối năm ngoái, CoreWeave đã tăng giá hơn 20% và yêu cầu khách hàng ký hợp đồng dài hạn hơn. Các nhà phân tích của Bank of America dự báo nhu cầu có thể vượt nguồn cung ít nhất đến năm 2029.
Giá thuê GPU của Nvidia cũng tăng mạnh. Chi phí thuê một GPU thế hệ mới trong một giờ đã tăng gần 50% chỉ trong hai tháng gần đây.
“Tình trạng thiếu hụt hiện nay là chưa từng thấy,” J.J. Kardwell, CEO công ty hạ tầng đám mây Vultr, cho biết. Ông cho rằng vấn đề không chỉ nằm ở thiết bị, mà còn ở thời gian xây dựng trung tâm dữ liệu và hạn chế nguồn điện — nhiều khu vực đã “đặt kín” công suất đến năm 2026.
Từ giữa tháng 2, các sự cố tại Anthropic trở nên thường xuyên đến mức một số khách hàng doanh nghiệp đã chuyển sang nền tảng khác.
Độ ổn định của các dịch vụ internet thường được đo bằng “số 9” — ví dụ 99,99% thời gian hoạt động là tiêu chuẩn phổ biến. Tuy nhiên, API Claude của Anthropic chỉ đạt 98,95% trong 90 ngày gần nhất, thấp hơn đáng kể so với mức doanh nghiệp kỳ vọng.
“Điều này là bất thường,” Amir Haghighat, đồng sáng lập công ty AI Baseten, nhận định. “Các dịch vụ như AWS hay Stripe cần độ ổn định rất cao, nhưng AI hiện chưa đạt được mức đó.”
Tình trạng gián đoạn diễn ra trong bối cảnh Anthropic tăng trưởng bùng nổ, với doanh thu dự kiến tăng nhanh chỉ trong vài tháng.
Cuối tháng 3, công ty bất ngờ giới hạn lượng token người dùng có thể sử dụng trong giờ cao điểm, khiến nhiều khách hàng phản ứng khi nhanh chóng chạm ngưỡng.
“Chúng tôi đang nỗ lực đáp ứng nhu cầu tăng mạnh,” đại diện công ty cho biết, đồng thời khẳng định năng lực tính toán là nguồn tài nguyên cần được quản lý chặt chẽ.
Nguồn Hà Nội Mới: https://hanoimoi.vn/con-sot-ai-dang-lam-can-kiet-nang-luc-tinh-toan-744732.html











