AI của Dược sĩ Tiến có thực sự 'hơn ChatGPT'?

6 giờ trước Gốc

Ông Phạm Minh Hữu Tiến công bố chatbot AI có thông số tốt hơn cả ChatGPT. Tuy nhiên, nhiều dữ liệu đưa ra còn mơ hồ, phi lý.

Dược sĩ Tiến (Phạm Minh Hữu Tiến) ra mắt AI tên ChatDST. Ảnh: DST.

Ngày 14/7, Dược sĩ Tiến đăng tải đoạn video giới thiệu về nhiều sản phẩm của công ty lên mạng xã hội. Trong đó, chatbot AI có tên ChatDST gây chú ý với tuyên bố “tốt hơn ChatGPT” của người trình bày.

Thông tin này gây tranh luận khi cá nhân ông Tiến và tổ chức đứng sau vốn làm việc ở lĩnh vực mỹ phẩm, chương trình giải trí, không có chuyên môn về công nghệ. Trong khi đó, ChatGPT của OpenAI được đầu tư hàng trăm tỷ USD cùng nhiều năm phát triển, vẫn là sản phẩm dẫn đầu thị trường ở nhiều mặt.

Tuyên bố của Dược sĩ Tiến

“Hầu như các thông số của Tiến đều vượt qua các các trí tuệ nhân tạo mà quý vị đang sử dụng hiện tại. Tiến hé lộ luôn với quý vị thông số này nó khá cao trên thị trường”, Phạm Minh Hữu Tiến (Dược sĩ Tiến) tuyên bố trong buổi ra mắt.

Thông số của chatbot ChatDST mà Dược sĩ Tiến đưa ra. Ảnh: Phạm Minh Hữu Tiến.

Ví dụ được người này lấy ra so sánh là dung lượng VRAM. Phạm Minh Hữu Tiến tuyên bố hệ thống họ xây dựng có bộ nhớ gấp đôi ChatGPT (960 GB so với 480 GB). “Bên cạnh đó nó còn có tính cách của em, được nạp vào dữ liệu trong ngành hóa, mỹ phẩm, sẽ giúp ích rất nhiều cho người làm trong lĩnh vực này”, ông Tiến nói.

Ngoài ra, thông số trên màn hình trình chiếu còn cho thấy nền tảng này có thể tạo ra 2.000 token mỗi giây, kiến trúc kết hợp 6 mô hình AI để tăng hiệu suất. ChatDST cam kết hoạt động ổn định trong 99,95% thời gian, xử lý ngữ cảnh đến 1 triệu token.

Đặc biệt, người giới thiệu còn cho biết chatbot này có bộ nhớ không giới hạn cho mỗi phiên làm việc. Dược sĩ Tiến tuyên bố giải pháp này sẽ ra mắt vào tháng 10, người dùng phải trả phí để sử dụng, giá 20-300 USD. Tuy nhiên, video sự kiện ra mắt hiện đã biến mất khỏi YouTube.

Những thông số bất thường

Trước mắt, dự án mà Dược sĩ Tiến tuyên bố vẫn nằm “trên giấy”, khi chưa có phiên bản dùng thử hay các báo cáo chi tiết về sourcecode hay vận hành. Những thông tin hiện có chỉ gồm thông số cơ bản, cùng tuyên bố ChatDST cấu hình cao hơn ChatGPT, thuộc nhóm tốt nhất trên thị trường.

Tuy nhiên, những thông tin này cũng mập mờ, nhiều phần vô lý, bất khả thi.

Trao đổi với Tri Thức - ZNews, ông N.B, Thạc sĩ Công nghệ Thông tin, người phát triển sản phẩm AI, cho rằng trong tuyên bố của Dược sĩ Tiến có phần thông tin nhầm lẫn.

Nhà máy AI trị giá 40 tỷ USD cho OpenAI đang được xây dựng ở Taxas, Mỹ. Ảnh: Data Center Dynamic.

Ví dụ, ông Tiến nói ChatDST phát triển trên nền tảng Llama 403 tỷ “neuron”. Thực tế, các mô hình ngôn ngữ lớn dùng đơn vị tham số (parameter) để nói về miền dữ liệu thay vì “neuron”. Đồng thời, Llama do Meta phát triển, công bố mã nguồn mở, chỉ có phiên bản 405 tỷ tham số, không có phiên bản nào 403 tỷ.

Mặt khác, không có nguồn nào cho thấy OpenAI dùng máy chủ có 480 GB bộ nhớ như Phạm Minh Hữu Tiến công bố. Theo thông số Dược sĩ Tiến đưa ra, ChatDST chạy trên nền tảng 12 chiếc GPU A100 80 GB của Nvidia, tổng là 960 GB VRAM. Giá thị trường của mỗi card đồ họa này vào khoảng 700 triệu đồng, tương đương mức đầu tư 8,4 tỷ đồng cho linh kiện này.

Trong khi đó, nguồn tin từ The Information cho biết OpenAI sở hữu trung tâm dữ liệu chứa khoảng 350.000 card A100 phục vụ suy luận. Riêng ChatGPT đang dùng 290.000 GPU, gấp 24.167 lần cấu hình mà Dược sĩ Tiến công bố. Ngoài ra, công ty này còn thuê máy chủ Azure của Microsoft để giảm tải khi lượng người dùng tăng lên.

Ước tính, OpenAI phải trả khoảng 100.000 USD (2,6 tỷ đồng) cho mỗi ngày hoạt động. Như vậy, chi phí vận hành cho 4 ngày của công ty này đã nhiều hơn số tiền cho cấu hình 12 chip A100 Dược sĩ Tiến dùng ở ChatDST.

Llama 405B chiếm ít nhất 810 GB VRAM để chứa mô hình hoạt động. Ảnh: HuggingFace.

Theo HuggingFace, Llama 405 tỷ tham số cần ít nhất 810 GB để chứa. Như vậy, máy chủ của ông Tiến chỉ còn trống 150 GB để phục vụ tính toán khi người dùng chat. Lượng VRAM này đủ cho 1-3 khách hàng chat cùng lúc. Ngay cả khi giảm độ chính xác của mô hình xuống để bớt tốn tài nguyên, lượng người dùng phục vụ đồng thời 3-9 tài khoản.

Tốc độ xử lý 2.000 token/s của ChatDST cũng là thông số “không tưởng” trong ngành. Hiện tại, ChatGPT chỉ cho ra 50-100 token/s tùy model và quá tải hệ thống. Claude cũng chỉ đáp ứng 40-80 token/s.

Hùng Phi

Nguồn Znews: https://znews.vn/ai-cua-duoc-si-tien-co-thuc-su-hon-chatgpt-post1569417.html