Tầm ảnh hưởng to lớn của Nvidia đằng sau màn trình diễn GPT-4o: OpenAI cám ơn Jensen Huang
Trong buổi giới thiệu GPT-4o rạng sáng 14.5 giờ Việt Nam, Mira Murati đã cảm ơn Jensen Huang vì đã cung cấp các bộ xử lý đồ họa (GPU) cần thiết giúp OpenAI trình diễn mô hình trí tuệ nhân tạo (AI) toàn mới của mình.
Bà Mira Murati là Giám đốc Công nghệ của OpenAI, còn ông Jensen Huang là Giám đốc điều hành của Nvidia.
Mira Murati nói trong buổi phát trực tiếp có tiêu đề “Cập nhật mùa xuân” của OpenAI: “Cảm ơn Jensen và đội ngũ Nvidia đã mang đến cho chúng tôi những GPU tiên tiến nhất để biến màn trình diễn này thành hiện thực ngày hôm nay”.
Đây là một minh chứng nữa cho thấy tầm ảnh hưởng to lớn của Nvidia trong cuộc chạy đua AI.
GPU Nvidia H100 có giá từ 30.000 đến 40.000 USD ((gần 1 tỉ đồng) mỗi chiếc, được các hãng công nghệ lớn tìm mua để đào tạo và vận hành mô hình AI của họ.
Microsoft, OpenAI, Google và Meta Platforms đang chạy đua để tích trữ Nvidia H100 khi tìm cách xây dựng các mô hình AI mạnh mẽ hơn bao giờ hết.
Microsoft đặt mục tiêu nội bộ là tích lũy 1,8 triệu GPU vào cuối năm 2024, theo tài liệu mà trang Insider nhìn thấy. Gã khổng lồ công nghệ Mỹ đang cố gắng tạo ra mô hình AI nhanh hơn, tốt hơn và rẻ hơn, nhưng nỗ lực này chủ yếu phụ thuộc vào việc công ty mua GPU từ Nvidia. Tài liệu nội bộ gợi ý rằng Microsoft có kế hoạch tăng gấp ba số lượng GPU mà hãng đang có vào năm 2024.
Đầu tư hơn 10 tỉ USD vào OpenAI, Microsoft đang dẫn đầu trong sự bùng nổ AI tạo sinh. Thế nhưng, duy trì vị trí hàng đầu trong lĩnh vực này là việc khó khăn và rất tốn kém.
Từ năm tài chính hiện tại đến năm tài chính 2027, Microsoft dự kiến sẽ chi khoảng 100 tỉ USD cho GPU và trung tâm dữ liệu, hai người quen thuộc với kế hoạch này nói với Insider.
Insider có được một tài liệu khác tiết lộ Microsoft đang đảm bảo có số lượng GPU kỷ lục để xử lý khối lượng công việc AI mới trong các trung tâm dữ liệu.
Trong nửa cuối năm ngoái, Microsoft đã cung cấp "lượng GPU ở mức kỷ lục", tăng hơn gấp đôi tổng số GPU đã được lắp đặt của mình, tài liệu nêu rõ mà không đề cập đến con số thực tế.
Số lượng và phạm vi GPU của Microsoft đã mở rộng sang thêm 39 trung tâm dữ liệu trong giai đoạn này. Gã khổng lồ công nghệ Mỹ hiện có nhóm các máy tính được kết nối và tối ưu hóa để thực hiện các tác vụ AI hoạt động tại 98 địa điểm trên toàn cầu.
Các nhà phân tích tại hãng DA Davidson ước tính rằng Microsoft đã chi 4,5 tỉ USD cho GPU Nvidia vào năm ngoái, con số mà một nhà quản lý tại Microsoft nói là gần với mức chi tiêu thực tế của họ.
Microsoft có nỗ lực nội bộ nhằm thiết kế chip AI của riêng mình nhằm giảm sự phụ thuộc vào Nvidia, nhưng một số nhân viên tỏ ra nghi ngờ dự án này vì công ty đi sau Nvidia nhiều năm và công nghệ tiên tiến phát triển quá nhanh.
Những gã khổng lồ công nghệ khác cũng đang xây dựng kho GPU khổng lồ. Mark Zuckerberg, Giám đốc điều hành Meta Platforms, cho biết công ty truyền thông xã hội này sẽ mua khoảng 350.000 GPU Nvidia H100 vào năm 2024. Kết hợp với số GPU tương đương từ các nhà cung cấp khác, Meta Platforms sẽ có tổng cộng khoảng 600.000 GPU vào cuối năm 2024, theo Mark Zuckerberg.
Nhu cầu về GPU giúp Nvidia tăng trưởng mạnh và trở thành hãng chip có giá trị nhất thế giới (vốn hóa thị trường hơn 2.270 tỉ USD). Nvidia hiện cũng là nhà cung cấp GPU số 1 thế giới.
Ngân hàng đầu tư đa quốc gia Goldman Sachs (Mỹ) mô tả Jensen Huang là "cha đỡ đầu của AI" trước báo cáo thu nhập quý 4/2023 của Nvidia, chứng kiến công ty đạt doanh thu 22,1 tỉ USD vào quý này, tăng 265% so với cùng kỳ năm trước.
Sự thống trị của Nvidia với ngành công nghiệp AI khó có thể sớm thay đổi. Nvidia đã trình làng chip AI mới nhất B200 Blackwell vào tháng 3.
Theo Nvidia, B200 Blackwell có tốc độ xử lý một số tác vụ nhanh hơn 30 lần so với H100. Jensen Huang cho biết B200 Blackwell sẽ giúp kích hoạt các tính năng AI tiên tiến, chẳng hạn chuyển lời nói thành video 3D.
Jensen Huang nói với trang CNBC rằng B200 Blackwell sẽ có giá từ 30.000 đến 40.000 USD. Sau đó, ông nói rằng Nvidia sẽ đưa B200 Blackwell vào các hệ thống máy tính lớn hơn và giá sẽ thay đổi tùy theo giá trị mà chúng mang lại.
Theo Nvidia, B200 Blackwell dự kiến sẽ xuất xưởng vào cuối năm 2024. Nvidia cho biết các khách hàng lớn gồm Amazon, Google, Microsoft, OpenAI và Oracle dự kiến sẽ sử dụng B200 Blackwell trong các dịch vụ điện toán đám mây mà họ cung cấp, cũng như các dịch vụ AI riêng.
Sam Altman, Giám đốc điều hành OpenAI, là người có thể thách thức vị trí thống trị của Nvidia trên thị trường GPU. Rộ tin Sam Altman đang cố gắng huy động tới 7.000 tỉ USD cho một dự án kinh doanh nhằm thúc đẩy nguồn cung chip AI của thế giới trong bối cảnh thiếu hụt toàn cầu.
Jensen Huang đã bày tỏ sự hoài nghi với thông tin về kế hoạch này, đồng thời nói đùa tại hội nghị thượng đỉnh ở Dubai (UAE) rằng 7.000 tỉ USD có thể mua được "tất cả các GPU".
"Cảm giác giống như AI trong phim"
Hôm 10.5, Sam Altman từng tiết lộ rằng bản cập nhật ChatGPT "giống như phép thuật" và ông không sai.
Trình làng GPT-4o có khả năng trò chuyện bằng giọng nói rạng sáng 14.5 giờ Việt Nam, OpenAI như gửi lời tuyên chiến đến các đối thủ lớn trong lĩnh vực công nghệ: Đến lượt các bạn!
Mira Murati đã giới thiệu bản cập nhật mùa xuân cho ChatGPT với hàng loạt màn trình diễn trực tiếp ấn tượng. Được hỗ trợ bởi GPT-4o, phiên bản ChatGPT mới có thể suy luận qua âm thanh, hình ảnh và văn bản trong thời gian thực.
Mira Murati cho biết GPT-4o “tốt hơn nhiều so với bất kỳ mô hình AI hiện có nào trong việc hiểu và thảo luận về những hình ảnh mà người dùng chia sẻ”.
Nhờ GPT-4o, người dùng có thể nói chuyện với ChatGPT và nhận được phản hồi theo thời gian thực mà không bị chậm trễ, cũng như ngắt lời ChatGPT khi chatbot này đang nói. Không những thế, ChatGPT có khả năng biểu đạt cảm xúc và thay đổi giọng điệu.
“Cảm giác giống như AI trong phim… Nói chuyện với máy tính chưa bao giờ thực sự tự nhiên với tôi; bây giờ thì có”, Sam Altman viết trong một bài đăng trên blog.
Trong bản demo, ChatGPT nói giọng nữ diễn viên Scarlett Johansson (Mỹ) trong phim Her, nhưng các nhà nghiên cứu của OpenAI chuyển sang giọng robot tại một số thời điểm. Một người phát ngôn OpenAI cho biết đầu ra âm thanh của ChatGPT sẽ bị giới hạn trong một số giọng nói nhất định.
ChatGPT không chỉ nói giống con người mà còn thể hiện khả năng bắt chước cách nói của chúng ta một cách đáng kinh ngạc. ChatGPT cười khúc khích, biết pha trò và điều chỉnh ngữ điệu giọng nói tùy thuộc vào lời nhắc.
Nó dường như cũng có khả năng nắm bắt một số tín hiệu của con người. Trong khi một nhà nghiên cứu OpenAI đang thở dốc lúc hít thở sâu, ChatGPT nói: "Anh không phải là máy hút bụi".
Người dùng cũng có thể ngắt lời ChatGPT, điều này làm cho cuộc trò chuyện cảm thấy tự nhiên hơn. Bạn không phải chờ chabtot AI kết thúc câu trả lời trước khi hỏi câu khác hoặc thay đổi chủ đề.
Thời gian ChatGPT phản hồi cũng nhanh chóng. Người phát ngôn của OpenAI cho biết phiên bản ChatGPT mới có thể phản hồi các đầu vào âm thanh với tốc độ tương tự con người, mất trung bình 320 mili giây.
Ngoài ra, ChatGPT còn thể hiện khả năng nâng cao để diễn giải đồ thị, viết mã lập trình, thể hiện cảm xúc và hướng dẫn người dùng về các phương trình toán học bằng cách xem video, hình ảnh được chiếu từ camera của smartphone.
Trong suốt quá trình đó, ChatGPT duy trì giọng điệu vui vẻ và vui tươi.
Trong một bản demo được chia sẻ trực tuyến, GPT-4o có thể phân tích video về không gian xung quanh một người dùng, nhận ra rằng người đó đang mặc áo hoodie của OpenAI và được bao quanh bởi thiết bị ghi hình…
Dù ChatGPT đôi khi gặp vài trục trặc, chẳng hạn diễn giải sai một yêu cầu về hình ảnh hoặc trả lời không chính xác trước khi câu hỏi hoàn thành, những khoảnh khắc này gần như làm cho chatbot AI trở nên giống con người hơn.
Tất cả điều này giúp ChatGPT vượt trội những gì chúng ta thấy từ các đối thủ của OpenAI.