Nvidia đặt cược vào 'kỷ nguyên suy luận' của AI
Nvidia cho rằng trí tuệ nhân tạo đang bước sang một giai đoạn mới: Không còn chỉ tập trung vào việc huấn luyện các mô hình khổng lồ, mà là khả năng vận hành chúng nhanh và hiệu quả trong các ứng dụng thực tế.
Phát biểu tại hội nghị công nghệ thường niên GTC ở San Jose ngày 16-3 (giờ địa phương), Giám đốc điều hành Nvidia Jensen Huang tuyên bố “kỷ nguyên suy luận” (Age of Inference) đã bắt đầu, khi các công ty công nghệ chuyển trọng tâm từ đào tạo mô hình AI sang triển khai chúng trong các dịch vụ và sản phẩm thương mại.

CEO của Nvidia Jensen Huang tại một sự kiện công nghệ. Nguồn: Nvidia
Trước hơn 30.000 người tham dự, CEO của Nvidia giới thiệu một loạt sản phẩm phần cứng và phần mềm mới nhằm giúp các hệ thống AI phản hồi nhanh hơn và vận hành tiết kiệm chi phí hơn.
Trọng tâm của chiến lược này là hệ thống máy chủ mới của Nvidia được thiết kế riêng cho tính toán suy luận, giai đoạn cho phép các mô hình AI trả lời câu hỏi của người dùng hoặc xử lý tác vụ trong thời gian thực.
Trong nhiều năm, Nvidia thống trị thị trường chip xử lý đồ họa (GPU) - loại chip chủ yếu dùng để huấn luyện các mô hình AI lớn. Tuy nhiên, khi các công ty công nghệ bắt đầu tìm cách thương mại hóa AI, nhu cầu đang dịch chuyển sang những hệ thống tối ưu cho suy luận, nơi tốc độ phản hồi và chi phí vận hành trở thành yếu tố quan trọng.
“Đây là tương lai của AI,” ông Huang nói. “Các hệ thống này được thiết kế cho suy luận - loại khối lượng công việc sẽ vận hành các ‘nhà máy AI’.”
Nvidia cho biết hệ thống mới có tốc độ xử lý nhanh vượt trội so với thế hệ chip trước đây của hãng, đồng thời được thiết kế để giảm bớt những hạn chế về bộ nhớ và tiêu thụ năng lượng vốn tồn tại trong các GPU truyền thống.
“Điểm bùng phát của suy luận AI đã đến,” Huang nói trong bài phát biểu chính. “Đây chính là yếu tố then chốt.”
Cùng với việc ra mắt công nghệ mới, Nvidia cũng đưa ra dự báo doanh số đầy tham vọng. Huang cho biết công ty kỳ vọng bán 1.000 tỷ USD chip Blackwell và Rubin vào cuối năm 2027, cao gấp đôi so với dự báo trước đó là 500 tỷ USD doanh số vào cuối năm 2026.
Song song với phần cứng, Nvidia cũng tìm cách mở rộng hệ sinh thái phần mềm AI. Công ty công bố một liên minh gồm các hãng công nghệ như Cursor, Mistral, Perplexity, Reflection và Thinking Machines nhằm thúc đẩy phát triển các mô hình AI mã nguồn mở tiên tiến.
Theo ông Huang, sáng kiến này có thể giúp tăng tốc quá trình chuyển đổi của ngành phần mềm doanh nghiệp từ mô hình software-as-a-service (SaaS) sang AI tác nhân dưới dạng dịch vụ, nơi các hệ thống AI có thể tự động thực hiện nhiều nhiệm vụ phức tạp.
Nvidia cũng tiếp tục mở rộng hoạt động trong lĩnh vực mô phỏng và “bản sao số” (digital twins), công nghệ cho phép tạo mô hình ảo của nhà máy hoặc hệ thống sản xuất để thử nghiệm và tối ưu hóa trước khi triển khai ngoài thực tế.
Trong lĩnh vực xe tự hành, công ty công bố thêm bốn đối tác mới cho nền tảng robotaxi của mình gồm BYD, Geely Auto, Hyundai và Nissan. Các hãng xe dự kiến sử dụng chip và công nghệ mô phỏng của Nvidia để mở rộng nhanh số lượng xe tự hành phục vụ dịch vụ gọi xe.
Cùng thời điểm, startup điện toán đám mây Nscale của Anh - được Nvidia hậu thuẫn thông báo kế hoạch xây dựng cụm trung tâm dữ liệu AI công suất 1,35 gigawatt tại bang West Virginia, sử dụng máy chủ mới của Nvidia. Dự án được mô tả là một trong những hạ tầng tính toán AI lớn nhất thế giới.
Nguồn Hà Nội Mới: https://hanoimoi.vn/nvidia-dat-cuoc-vao-ky-nguyen-suy-luan-cua-ai-739262.html











