Nvidia chuyển hướng sang chip AI suy luận tốc độ cao

CEO của Nvidia Jensen Huang dự kiến sẽ ra mắt sản phẩm mới tại hội nghị công nghệ GTC tuần tới, khi chi tiêu AI chuyển từ huấn luyện sang vận hành mô hình.

2 giờ trước Gốc

Theo đó, chip AI mới được phát triển nhằm tăng tốc phản hồi của các mô hình trí tuệ nhân tạo, đánh dấu sự thay đổi so với chiến lược lâu nay khi sử dụng cùng một bộ xử lý cho nhiều nhiệm vụ khác nhau.

CEO Nvidia Jensen Huang tại sự kiện GTC năm 2024. Nguồn: Nvidia

Theo các nguồn tin am hiểu kế hoạch của công ty trước thềm hội nghị nhà phát triển GTC diễn ra tuần tới, Giám đốc điều hành Jensen Huang dự kiến sẽ công bố một con chip tập trung vào “inference” - tức giai đoạn chạy mô hình AI để tạo phản hồi thay vì huấn luyện mô hình.

Đây sẽ là sản phẩm mới đầu tiên sau thương vụ trị giá khoảng 20 tỷ USD được công bố vào tháng 12 nhằm chiêu mộ các nhà sáng lập của Groq, một start-up phát triển LPU (Language Processing Unit – chip xử lý ngôn ngữ cho AI) được tối ưu cho việc trả lời nhanh các truy vấn AI phức tạp.

Ba tháng sau thương vụ này, Nvidia dự kiến sẽ giới thiệu một LPU dựa trên công nghệ của Groq để hoạt động song song với bộ xử lý đồ họa thế hệ mới Vera Rubin. Đây là một phần trong dòng sản phẩm mới nhằm đối phó với các đối thủ đang nổi lên và đáp ứng các ứng dụng AI ngày càng đa dạng.

Động thái này diễn ra khi công ty giá trị nhất thế giới đang đối mặt với áp lực cạnh tranh từ các start-up cũng như các khách hàng lớn như Google, vốn đang phát triển chip AI riêng. Tuần này, Meta cũng công bố một dòng bốn bộ xử lý mới tập trung vào tác vụ inference.

“Một giai đoạn thú vị đang mở ra, khi thị trường không còn hoàn toàn do Nvidia thống trị,” một nhà đầu tư mạo hiểm tại Thung lũng Silicon nhận định.

Trong ba năm qua, Nvidia đã đạt mức vốn hóa khoảng 4.500 tỷ USD, phần lớn nhờ các GPU của hãng trở thành nền tảng cốt lõi của ngành AI tạo sinh, dùng để huấn luyện những mô hình đứng sau các dịch vụ như ChatGPT của OpenAI.

Jensen Huang từng cho rằng một hệ thống GPU duy nhất có thể đảm nhiệm cả việc huấn luyện mô hình lẫn vận hành các ứng dụng như chatbot hay công cụ lập trình. Các tập đoàn công nghệ lớn đã chi hàng trăm tỷ USD triển khai những hệ thống này, dù đồng thời cũng đầu tư phát triển các loại chip AI chuyên biệt.

Tuy nhiên, sự phát triển nhanh chóng của các công cụ AI phức tạp hơn, chẳng hạn các hệ thống lập trình tự động “agentic”, đang buộc Nvidia phải điều chỉnh quan điểm rằng một GPU có thể xử lý mọi loại khối lượng công việc.

Theo các nguồn tin, thương vụ với Groq trị giá khoảng 20 tỷ USD là một trong những giao dịch lớn nhất trong lịch sử 33 năm của Nvidia. Thỏa thuận bao gồm việc cấp phép công nghệ và tuyển dụng nhiều nhân sự chủ chốt, trong đó có nhà sáng lập Groq và cựu lãnh đạo chip của Google, Jonathan Ross.

Trước đây, Groq - công ty từng hợp tác với Samsung để sản xuất chip quảng bá rằng, các LPU của họ có thể xử lý tác vụ inference nhanh và hiệu quả hơn GPU của Nvidia.

Các hệ thống chủ lực của Nvidia nhưBlackwell và Rubin hiện dựa vào bộ nhớ băng thông cao (HBM) để xử lý khối lượng dữ liệu khổng lồ của các mô hình AI.

Tuy nhiên, HBM có chi phí rất cao và ngày càng khan hiếm khi các nhà sản xuất bộ nhớ như SK Hynix và Micron gặp khó khăn trong việc đáp ứng nhu cầu bùng nổ từ ngành AI.

Theo các nguồn tin, dòng chip mới theo hướng Groq sẽ sử dụng SRAM (Static Random Access Memory - bộ nhớ tốc độ cao) thay vì DRAM dùng trong HBM. SRAM dễ tiếp cận hơn và phù hợp cho các tác vụ suy luận và “lập luận” của AI.

Các nhà phân tích của Bank of America ước tính khi thị trường trung tâm dữ liệu AI đạt quy mô khoảng 1.200 tỷ USD vào năm 2030, các tác vụ inference sẽ chiếm khoảng 75% tổng chi tiêu, so với khoảng 50% vào năm ngoái.

Trong một báo cáo tuần này, họ cho rằng sự kiện lớn sắp tới của Nvidia có thể công bố một “danh mục AI mở rộng”, bao gồm con chip dựa trên SRAM phát triển từ công nghệ của Groq.

Ngoài ra, các chip inference có ưu điểm là có thể triển khai nhanh và dễ dàng hơn trong các trung tâm dữ liệu hiện có, theo June Paik, Giám đốc điều hành của FuriosaAI - một đối thủ của Nvidia.

“Rất nhiều doanh nghiệp muốn chạy inference ngay trên các trung tâm dữ liệu hiện có, nhưng phần lớn cơ sở hạ tầng hiện nay không thể hỗ trợ các GPU làm mát bằng chất lỏng thế hệ mới,” Paik nói.

“Trung tâm dữ liệu trong tương lai sẽ không còn là một thế giới ‘một giải pháp cho tất cả’,” Ben Bajarin, nhà phân tích công nghệ tại Creative Strategies, nhận định.

Ngọc Lâm

Nguồn Hà Nội Mới: https://hanoimoi.vn/nvidia-chuyen-huong-sang-chip-ai-suy-luan-toc-do-cao-738252.html

Quét mã QR có làm điện thoại nhanh hết pin hơn? Sự thật và cách khắc phục

Chuyên trang Hoa Học Trò - Báo Tiền Phong

4 giờ

Motorola Edge 70 Fusion+ 5G ra mắt với màn hình 5,200 nits và chuẩn kháng nước IP69

1 giờ

Lộ diện cấu hình OPPO Find X9s Pro: Chip Dimensity 9500 và hệ thống camera kép 200MP siêu khủng

2 giờ

Tin nóng

Bên trong phòng thí nghiệm 29 triệu USD dạy robot làm việc nhà của Trung Quốc

27 phút

Trung Quốc ồ ạt lập các trạm huấn luyện, nơi con người trực tiếp điều khiển để tạo dữ liệu dạy robot hình người, nhằm hiện thực hóa tham vọng dẫn đầu về AI.

Phiên bản iOS 26.4 Beta có nhiều thay đổi đáng chú ý

3 giờ

iOS 26.4 được cho là sẽ mang đến nhiều cải tiến đáng chú ý về hiệu năng, tính năng và trải nghiệm, khiến nhiều người dùng iPhone háo hức muốn nhấn cập nhật ngay khi phiên bản mới được phát hành.

iPhone 18 Pro: 7 nâng cấp đáng mong đợi xuất hiện vào mùa thu này

7 giờ

iPhone 18 Pro và iPhone 18 Pro Max hứa hẹn sẽ có những cải tiến mạnh về hiệu năng, camera, pin và các phiên bản màu, những nâng cấp khiến các iFan phấn khích.

Cách kích hoạt iPhone cũ chỉ trong vài bước đơn giản

2 giờ

Bạn muốn kích hoạt lại iPhone cũ để thiết bị hoạt động ổn định như ban đầu? Bài viết sẽ hướng dẫn cách kích hoạt iPhone qua iTunes hoặc bằng SIM, không cần iCloud.

Khai mở 'mỏ vàng' vũ trụ: Dấu mốc lịch sử định hình kinh tế số Việt Nam

2 giờ

Trong kỷ nguyên số, dữ liệu vũ trụ là nguồn 'dầu mỏ' mới chiến lược. Sự kiện khánh thành Trung tâm Vũ trụ Việt Nam chính là bước ngoặt kiến tạo hạ tầng nền kinh tế, bảo vệ chủ quyền và nâng tầm vị thế quốc gia.

Cơ hội nâng cấp máy tính đầu năm 2026 khi giá MacBook chạm đáy

2 giờ

Đầu năm 2026 chứng kiến đợt điều chỉnh giá mạnh của các dòng máy tính xách tay Apple. MacBook Air M2, M3, M4 và dòng MacBook Neo mới.

Tin mới

Ngày Toán học Quốc tế 14/3: Toán học - Niềm tin và Hy vọng

4 phút

Sáng 14/3, tại Hà Nội, Trung tâm Nghiên cứu và Đào tạo Toán học quốc tế UNESCO (Trung tâm Toán UNESCO) phối hợp với Viện Toán học cùng Trung tâm Dữ liệu và Thông tin Khoa học (thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam), Trường đại học Khoa học và Công nghệ Hà Nội tổ chức Diễn đàn khoa học với chủ đề 'Toán học – Niềm tin và Hy vọng'. Sự kiện được tổ chức nhân Ngày Toán học Quốc tế (14/3).

Hải Phòng xây dựng lộ trình đổi mới công nghệ 8 ngành kinh tế mũi nhọn

Bnews22 phút

Ứng dụng khoa học công nghệ không chỉ là khẩu hiệu mà đang trở thành 'chìa khóa' giúp các doanh nghiệp tại Hải Phòng tạo ra đột phá trong phát triển.

Hà Nội hành động để 'kéo' người dân đi xe buýt, tàu điện

26 phút

Lễ phát động phong trào 'Vận tải hành khách công cộng văn minh – vì hành khách phục vụ' được xem là bước đi nhằm nâng cao chất lượng dịch vụ, xây dựng văn hóa giao thông công cộng và thu hút người dân Hà Nội sử dụng xe buýt, tàu điện.

Robot hình người làm 'thực tập sinh' trong nhà máy xe điện Trung Quốc

1 giờ

Nhiều công ty robot tại Trung Quốc đã bắt đầu phát triển và sản xuất hàng loạt robot humanoid với mục tiêu ứng dụng trong nhà máy, dịch vụ và chăm sóc người già. Chính phủ Trung Quốc cũng coi robot hình người là một ngành công nghiệp chiến lược trong thập kỷ tới.

3,5 tỉ người dùng Google Chrome nên làm điều này ngay

1 giờ

Google vừa tung ra bản cập nhật bảo mật khẩn cấp cho trình duyệt Chrome sau khi xác nhận 2 lỗ hổng zero-day đã bị khai thác ngoài thực tế.

Quân đội Séc thử nghiệm xe chiến đấu bộ binh CV9030CZ Mk IV tại Thụy Điển

1 giờ

Thử nghiệm mùa Đông tại Thụy Điển là bước quan trọng để Cộng hòa Séc đưa 246 xe thiết giáp CV9030CZ Mk IV vào biên chế, thay thế khí tài cũ và đạt chuẩn NATO.

'90 ngày' đưa nghị quyết vào cuộc sống: Tạo chuyển biến rõ nét trong phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số

1 giờ

Sau lễ phát động cao điểm '90 ngày cụ thể hóa và tuyên truyền, phổ biến các nghị quyết của HĐND thành phố Hà Nội về khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số', nhiều cam kết đã được đưa ra với tinh thần phải có sản phẩm, có chuyển biến rõ nét. Ba tháng nhìn lại, đợt cao điểm theo Kế hoạch 316/KH-UBND ngày 26-11-2025 không chỉ dừng ở truyền thông, mà đã tạo ra những kết quả bước đầu, đặt nền móng cho hệ sinh thái đổi mới sáng tạo của Thủ đô.

Chính quyền ông Trump thu 10 tỷ USD phí môi giới thương vụ bán TikTok

1 giờ

Chính phủ Mỹ dự kiến thu khoảng 10 tỷ USD phí trung gian sau khi đứng ra thúc đẩy thương vụ bán hoạt động của TikTok cho liên danh một số nhà đầu tư của nước này.