DeepSeek giúp giảm chi phí áp dụng AI cho các doanh nghiệp trên khắp Đông Nam Á
Nhiều doanh nghiệp trong khu vực Đông Nam Á vẫn phải vật lộn với tình trạng thiếu nhân tài trí tuệ nhân tạo (AI) và cơ sở hạ tầng kỹ thuật số lỗi thời.
Theo một số chuyên gia, các mô hình AI tiên tiến của DeepSeek giúp giảm chi phí áp dụng công nghệ này cho các doanh nghiệp vừa và nhỏ (SME) ở Đông Nam Á, song nhiều công ty vẫn phải vật lộn với tình trạng thiếu nhân tài và cơ sở hạ tầng kỹ thuật số lỗi thời.
"Tôi nghĩ rằng sự đột phá của DeepSeek là một điều khá tốt cho các doanh nghiệp vừa và nhỏ tại Malaysia. Những công ty khởi nghiệp này có thể bắt đầu với chi phí rất thấp để theo đuổi sự đổi mới", Leo Liu Binxing, Phó chủ tịch kinh doanh quốc tế tại Alibaba Cloud Intelligence, nói trong cuộc thảo luận tại hội nghị Trung Quốc: Đông Nam Á 2025 do tờ SCMP tổ chức tại Kuala Lumpur (thủ đô Malaysia) hôm 17.2.
Theo Leo Liu Binxing, với khả năng tiếp cận mô hình AI mạnh mẽ được cung cấp thông qua dịch vụ đám mây, các công ty khởi nghiệp sẽ "chỉ cần tập trung vào ý tưởng của mình".
Alibaba Cloud Intelligence là đơn vị thuộc gã khổng lồ thương mại điện tử Alibaba, chuyên cung cấp các dịch vụ điện toán đám mây và trí tuệ nhân tạo (AI). Đây là nhà cung cấp dịch vụ đám mây hàng đầu Trung Quốc, cung cấp các giải pháp về lưu trữ dữ liệu, xử lý AI, phân tích dữ liệu lớn (Big Data), bảo mật đám mây và nhiều dịch vụ công nghệ khác cho doanh nghiệp và chính phủ.
Đánh giá tích cực đó phản ánh sự chú ý trên toàn thế giới mà công ty khởi nghiệp DeepSeek (Trung Quốc) nhận được vài tuần qua khi phát hành hai mô hình AI nguồn mở tiên tiến, V3 và R1, với chi phí đào tạo và sức mạnh tính toán chỉ bằng một phần nhỏ so với các hãng công nghệ lớn thường cần cho các dự án mô hình ngôn ngữ lớn. Mô hình ngôn ngữ lớn là công nghệ nền tảng cho các dịch vụ AI tạo sinh như ChatGPT và chatbot cùng tên của DeepSeek.
Mã nguồn mở cho phép công chúng truy cập vào mã nguồn của một chương trình phần mềm, giúp các nhà phát triển bên thứ ba có thể sửa đổi hoặc chia sẻ thiết kế, khắc phục lỗi hoặc mở rộng khả năng của nó.
Theo DeepSeek, mô hình ngôn ngữ lớn V3 của họ (ra mắt vào tháng 12.2024) đã được huấn luyện bằng 2.048 GPU (bộ xử lý đồ họa) Nvidia H800 trong vòng hai tháng. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.
Trong một bài viết về V3, DeepSeek tuyên bố rằng quá trình huấn luyện mô hình này chỉ tiêu tốn 2,8 triệu giờ GPU với chi phí 5,6 triệu USD, chỉ bằng một phần nhỏ thời gian và tiền bạc mà các công ty Mỹ bỏ ra cho các mô hình AI của họ.
R1, mô hình lập luận mã nguồn mở của DeepSeek được phát hành vào ngày 20.1, thể hiện năng lực tương đương sản phẩm tiên tiến từ OpenAI, Anthropic và Google, nhưng chi phí đào tạo thấp hơn đáng kể. Tuy nhiên, bài viết của DeepSeek về R1 không đề cập đến chi phí phát triển.
Các mô hình DeepSeek có chi phí thấp và hiệu suất mạnh mẽ làm dấy lên nghi ngờ về sự cần thiết của khoản đầu tư khổng lồ từ các gã khổng lồ công nghệ Mỹ, đặc biệt là vào chip AI đắt đỏ. Điều này đã dẫn đến đợt bán tháo lớn cổ phiếu Nvidia hôm 27.1, khiến vốn hóa hãng chip AI hàng đầu của Mỹ giảm gần 600 tỉ USD chỉ trong một ngày.

Theo một số chuyên gia, các mô hình AI tiên tiến của DeepSeek giúp giảm chi phí áp dụng công nghệ này cho các doanh nghiệp vừa và nhỏ (SME) ở Đông Nam Á - Ảnh: Internet
Các nhà cung cấp dịch vụ điện toán đám mây lớn, gồm Alibaba, Huawei, Tencent, Microsoft và Amazon Web Services, đã tích hợp DeepSeek vào nền tảng của họ.
Công nghệ điện toán đám mây cho phép các doanh nghiệp quản lý hoặc phân phối qua internet hàng loạt phần mềm và tài nguyên kỹ thuật số khác dưới dạng dịch vụ theo yêu cầu, giống lưới điện. Các tài nguyên này được lưu trữ bên trong trung tâm dữ liệu.
Sarah Lim, đối tác đầu tư tại OSK Ventures International, bình luận: "Với các công ty khởi nghiệp, đây là lợi thế rất lớn, nhưng họ cần thời gian để thích nghi. Tôi nghĩ trong năm tới hoặc lâu hơn, sẽ không ngạc nhiên nếu nhiều công ty trong danh mục đầu tư của chúng tôi quay lại và nói rằng: Vâng, chúng tôi đã tích hợp DeepSeek rồi".
OSK Ventures International là công ty đầu tư mạo hiểm có trụ sở tại Kuala Lumpur. Được thành lập vào năm 2000, OSK Ventures International cung cấp vốn cổ phần và nợ cho các công ty từ giai đoạn khởi nghiệp đã thương mại hóa đến các doanh nghiệp đang tăng trưởng mạnh mẽ. Công ty tập trung đầu tư vào các lĩnh vực như công nghệ tài chính, chăm sóc sức khỏe, công nghệ doanh nghiệp, ESG (Môi trường, Xã hội và Quản trị) và các công nghệ mới nổi.
Tuy nhiên, nhiều doanh nghiệp trên khắp Đông Nam Á có thể chưa chuẩn bị đầy đủ để áp dụng AI vì phải đối mặt với nhiều vấn đề, bao gồm quản trị dữ liệu, thiếu nhân tài và cơ sở hạ tầng lỗi thời, theo các thành viên tham gia hội nghị Trung Quốc: Đông Nam Á 2025.
Dù việc Malaysia ra mắt văn phòng AI quốc gia vào tháng 12.2024 là "khởi đầu tốt", nước này vẫn cần nhiều nhân tài hơn để giúp ngành công nghiệp này tiến lên, theo Jacky Cheong - người đứng đầu bộ phận quản trị dữ liệu doanh nghiệp tại CelcomDigi. CelcomDigi là nhà mạng di động lớn nhất Malaysia.
"Những nhân tài như vậy luôn thiếu trong bức tranh tổng thể khi chúng ta có một kế hoạch lớn. Chúng ta không có đủ người để thực hiện các mục tiêu giúp 'bảo vệ tương lai' Malaysia và khu vực ASEAN rộng lớn hơn", Jacky Cheong nói.
Theo một số thành viên tham gia hội nghị, các tổ chức phải chuẩn bị cơ sở hạ tầng kỹ thuật số của mình trước khi áp dụng AI và thực hiện các bước để giáo dục người dân.
Jacky Cheong nói nhiều doanh nghiệp phải đối mặt với những thách thức về khả năng tương tác dữ liệu. Ông cho biết rất nhiều dữ liệu của công ty vẫn nằm trong các bảng tính và hệ thống quản lý thông tin không được kết nối với các hệ thống khác như vậy.
Theo Jacky Cheong, phải đảm bảo dữ liệu chính xác, đầy đủ và có cấu trúc ngay từ đầu để tránh gặp phải vấn đề khi triển khai các hệ thống hoặc công nghệ mới như AI.