DeepSeek phát triển mạnh mẽ nhờ có lợi thế này so với OpenAI

7 giờ trước Gốc

Chuyên gia Yang Hongxia tại Đại học Bách khoa Hồng Kông cho biết DeepSeek có lợi thế so với các đối thủ do chỉ tập trung vào phát triển mô hình trí tuệ nhân tạo (AI).

Sự tập trung duy nhất vào các tiến bộ công nghệ đã giúp công ty khởi nghiệp DeepSeek (Trung Quốc) phát triển mạnh mẽ, theo nhà khoa học AI Yang Hongxia. Trong khi đó, OpenAI (đối thủ Mỹ của DeepSeek) đang đối mặt với những thách thức pháp lý về bản quyền từ các chủ sở hữu nội dung và vụ kiện từ nhà đồng sáng lập Elon Musk.

Bà Yang Hongxia, Phó trưởng khoa phụ trách hợp tác toàn cầu tại Đại học Bách khoa Hồng Kông, nói trong một diễn đàn rằng DeepSeek tương đối “không bị ảnh hưởng bởi áp lực sản phẩm và kinh doanh thương mại, vốn là mối lo ngại thường xuyên với các hãng công nghệ lớn”.

“DeepSeek chỉ tập trung vào phát triển các mô hình ngôn ngữ lớn”, Yang Hongxia nói tại sự kiện DeepSeek và Xa hơn nữa được tổ chức tại Đại học Bách khoa Hồng Kông.

Nhận định này phần nào phản ánh quan điểm của Chủ tịch Alibaba Joe Tsai, người nói tại Dubai (UAE) vào tháng trước rằng bước đột phá của DeepSeek trong việc phát triển các mô hình ngôn ngữ lớn vừa rẻ vừa hiệu quả là “rất đáng kể” và có thể truyền cảm hứng cho nhiều nhà phát triển AI tập trung vào các giải pháp mã nguồn mở.

Mô hình ngôn ngữ lớn là công nghệ nền tảng cho các trợ lý AI tạo sinh như ChatGPT của OpenAI và chatbot cùng tên DeepSeek.

Mã nguồn mở cho phép công chúng truy cập vào mã nguồn của một chương trình, giúp các nhà phát triển phần mềm bên thứ ba có thể sửa đổi, chia sẻ thiết kế, khắc phục lỗi hoặc mở rộng khả năng của mô hình.

Gia nhập Đại học Bách khoa Hồng Kông năm ngoái sau khi làm việc với các mô hình AI tại Alibaba và ByteDance (công ty mẹ TikTok), Yang Hongxia kêu gọi tích hợp AI vào chương trình giáo dục cơ bản. Đây là đề xuất phù hợp với nỗ lực của chính quyền Hồng Kông trong việc biến thành phố này thành trung tâm công nghệ.

Bà cũng nhấn mạnh sự hợp tác chặt chẽ hơn giữa Hồng Kông và các thành phố ở Trung Quốc đại lục để thúc đẩy đổi mới công nghệ.

Bà Yang Hongxia hảo luận về thành công của DeepSeek tại một diễn đàn được tổ chức tại Đại học Bách khoa Hồng Kông - Ảnh: Handout

Lời kêu gọi trên xuất hiện sau khi Sun Dong, lãnh đạo Cơ quan Đổi mới, Công nghệ và Công nghiệp Hồng Kông, tuyên bố rằng các hướng dẫn về phát triển và ứng dụng AI của thành phố sẽ sớm được công bố.

Theo ông Sun Dong, HKGAI V1 (công cụ AI do Hồng Kông phát triển dựa trên mô hình của DeepSeek) đã được xếp hạng an toàn nhất thế giới vào tháng trước, trích dẫn một báo cáo chưa được tiết lộ.

Do Hong Kong Generative AI Research and Development Centre (Trung tâm Nghiên cứu và phát triển AI tạo sinh Hồng Kông) thuộc chương trình InnoHK phát triển, HKGAI V1 dự kiến sẽ được thử nghiệm bởi hơn 70 cơ quan chính phủ trước khi công bố rộng rãi cho công chúng.

InnoHK là sáng kiến nghiên cứu và đổi mới công nghệ hàng đầu do chính quyền Hồng Kông thành lập. Chương trình này nhằm thu hút các viện nghiên cứu hàng đầu thế giới và thúc đẩy sự phát triển của Hồng Kông thành một trung tâm công nghệ toàn cầu.

Ra mắt vào tháng 5.2023 và được hậu thuẫn bởi quỹ đầu cơ định lượng High-Flyer của Trung Quốc, DeepSeek hưởng lợi từ cơ cấu tinh gọn cũng như không chịu áp lực huy động vốn hoặc kiếm lợi nhuận ngay lập tức.

Đầu tháng 3, DeepSeek đã công bố một số dữ liệu về chi phí và doanh thu liên quan đến mô hình trí tuệ nhân tạo nguồn mở V3 và R1 nổi tiếng của họ, khẳng định tỷ lệ chi phí - lợi nhuận lý thuyết có thể lên tới 545% mỗi ngày. Tuy nhiên, công ty Trung Quốc này lưu ý rằng doanh thu thực tế sẽ thấp hơn đáng kể.

Đây là lần đầu tiên công ty có trụ sở tại thành phố Hàng Châu tiết lộ thông tin về biên lợi nhuận từ các tác vụ suy luận ít tốn tài nguyên tính toán hơn. Suy luận là giai đoạn mô hình AI (sau khi được trải qua quá trình đào tạo) thực hiện dự đoán hoặc nhiệm vụ, chẳng hạn qua chatbot.

Trong bài đăng trên nền tảng mã nguồn mở GitHub, DeepSeek cho biết: “Nếu giả định chi phí thuê một chip H800 là 2 USD/giờ, tổng chi phí suy luận hằng ngày cho mô hình V3 và R1 là 87.072 USD. Trong khi đó, doanh thu lý thuyết từ hai mô hình này là 562.027 USD/ngày, dẫn đến tỷ lệ chi phí-lợi nhuận 545%. Tính theo năm, doanh thu sẽ đạt hơn 200 triệu USD”.

Tuy nhiên, DeepSeek nhấn mạnh doanh thu thực tế thấp hơn nhiều do phí sử dụng mô hình V3 thấp hơn R1, chỉ một số dịch vụ kiếm được tiền trong khi truy cập web và ứng dụng vẫn miễn phí. Hơn nữa, nhà phát triển trả ít hơn vào giờ thấp điểm.

Hôm 26.2, DeepSeek đã giới thiệu mức giá giảm sâu cho các nhà phát triển muốn sử dụng mô hình AI của hãng để xây dựng sản phẩm riêng. Động thái này có thể gây áp lực lên các đối thủ ở Trung Quốc và quốc tế trong việc cắt giảm giá.

DeepSeek cho biết trong khung giờ từ 16:30 GMT đến 00:30 GMT, chi phí sử dụng API (nền tảng cho phép các nhà phát triển tích hợp mô hình AI của DeepSeek vào ứng dụng và sản phẩm web) sẽ giảm tới 75%, đồng thời mở lại nạp tiền cho dịch vụ này sau hơn 2 tuần tạm dừng do quá tải nhu cầu.

Theo bảng giá trên trang web của DeepSeek, chi phí sử dụng API củamô hình R1 và V3 trong khung giờ này sẽ giảm lần lượt 75% và 50%.

Dù DeepSeek gọi khung giờ này là "ngoài giờ cao điểm" vì kéo dài từ 0 giờ 30 đến 8 giờ 30 theo giờ Bắc Kinh, nhưng thực tế lại rơi vào ban ngày tại châu Âu và Mỹ.

Ngoài thông tin về biên lợi nhuận, DeepSeek còn tiết lộ các chi tiết kỹ thuật về quá trình phát triển mô hình suy luận R1 có hiệu suất ngang bằng o1 của OpenAI, với chi phí chỉ bằng một phần nhỏ so với thông thường. Đây là động thái được cho là sẽ thúc đẩy những tiến bộ toàn cầu trong lĩnh vực này.

Cuối tháng 2, DeepSeek đã công bố 8 dự án nguồn mở trên GitHub. Đây là lần đầu tiên DeepSeek tiết lộ chi tiết về cách họ khai thác hiệu suất tốt nhất từ các chip trong tính toán, truyền thông và lưu trữ, vốn là những yếu tố then chốt của đào tạo mô hình AI.

Nhóm các nhà khoa học trẻ của DeepSeek cho biết đã tiết lộ "các khối xây dựng được thử nghiệm trong thực tế để chia sẻ tiến bộ tuy nhỏ nhưng chân thành với sự minh bạch tuyệt đối".

DeepSeek được các nhà phát triển toàn cầu hoan nghênh, ca ngợi vì tiết lộ các kỹ thuật mà họ sử dụng để xây dựng các mô hình AI hiệu suất cao, chi phí thấp của mình. Một số nhà phát triển, gồm cả người sáng lập nền tảng phát triển AI Hyperbolic, gọi DeepSeek mới là "OpenAI thực sự".

Dù có tên gọi như vậy nhưng OpenAI đã chuyển sang phương pháp tiếp cận nguồn đóng, giữ kín các phương pháp đào tạo cụ thể và chi phí tính toán của các mô hình AI. Sam Altman, người đồng sáng lập kiêm Giám đốc điều hành OpenAI, nói đầu tháng 2 rằng công ty "đã đi ngược lại lịch sử" và "cần tìm ra một chiến lược nguồn mở khác".

Xung đột giữa OpenAI và Elon Musk

OpenAI đã vướng vào tranh chấp với Elon Musk từ năm ngoái. Tỷ phú giàu nhất thế giới cáo buộc OpenAI, công ty mà ông đồng sáng lập năm 2015 nhưng rời bỏ vào năm 2018, đã đi chệch khỏi sứ mệnh phi lợi nhuận ban đầu.

OpenAI đã phản hồi vào ngày 14.3, gọi vụ kiện của Elon Musk là “vô căn cứ và mang tính vụ lợi cá nhân”. OpenAI tuyên bố: "Vụ kiện này luôn xoay quanh lợi ích cá nhân của Elon và công ty AI vì lợi nhuận của ông ấy".

Năm 2023, Elon Musk thành lập công ty xAI để cạnh tranh với OpenAI, huy động được 6 tỉ USD trong vòng tài trợ Series B vào năm ngoái.

Đầu tháng 3, một thẩm phán liên bang tại bang California (Mỹ) đã từ chối yêu cầu của Elon Musk nhằm ngăn OpenAI chuyển đổi sang mô hình vì lợi nhuận. Cả OpenAI và Elon Musk đã đề xuất đưa vụ việc ra xét xử vào tháng 12.

Ngoài việc xung đột với Elon Musk, OpenAI đang bị nhiều nhà sáng tạo nội dung và nhà xuất bản kiện vì sử dụng tài liệu có bản quyền để đào tạo các mô hình ngôn ngữ lớn mà không có sự cho phép.

Cả OpenAI và Google đang vận động chính phủ Mỹ cho phép họ sử dụng tài liệu có bản quyền để huấn luyện mô hình AI của mình.

Sơn Vân