'Quái kiệt' Lương Văn Phong: Cha đẻ DeepSeek khiến đế chế AI tỷ đô rúng động

Chỉ trong thời gian ngắn, DeepSeek từ một startup ít tên tuổi đã vươn lên khiến 'đế chế' Google lẫn OpenAI phải rúng động. 'Cha đẻ' DeepSeek Lương Văn Phong đã định nghĩa lại cuộc chơi trong lĩnh vực AI.

Ông Lương Văn Phong, nhà sáng lập DeepSeek, đã tạo nên một bước ngoặt trong lĩnh vực trí tuệ nhân tạo, thách thức các gã khổng lồ như Google và OpenAI. Sự thành công của DeepSeek đã gây ra làn sóng chấn động trong ngành công nghệ toàn cầu.

Trong khi các tập đoàn công nghệ lớn như Alibaba, Baidu và Tencent đầu tư mạnh vào AI, đặc biệt là phần cứng và khách hàng, DeepSeek chọn chiến lược mã nguồn mở. Điều này giúp công ty nhanh chóng thu hút người dùng và tạo dựng cộng đồng trước khi triển khai các mô hình kinh doanh kiếm tiền. Cùng với 01.AI của Lý Khai Phục, DeepSeek đang góp phần định hình lại cuộc đua AI tại Trung Quốc.

 Ông Lương Văn Phong trong buổi gặp Thủ tướng Trung Quốc Lý Cường. Ảnh: Vietnamplus.

Ông Lương Văn Phong trong buổi gặp Thủ tướng Trung Quốc Lý Cường. Ảnh: Vietnamplus.

DeepSeek: Từ công ty non trẻ đến “kẻ ngáng đường” Google và OpenAI

Năm 2023, khi cuộc đua AI toàn cầu đang dần nóng lên với sự thống trị của OpenAI, Google DeepMind và các ông lớn Trung Quốc như Baidu, Tencent, ít ai để ý đến sự xuất hiện của một cái tên mới: DeepSeek. Chỉ trong hơn một năm, DeepSeek từ một startup ít tên tuổi đã vươn lên trở thành một thế lực đáng gờm trong làng AI, khiến cả Google lẫn OpenAI phải dè chừng.

Thành lập với số vốn vỏn vẹn 10 triệu NDT (khoảng 1,4 triệu USD), công ty này không có sự hậu thuẫn tài chính mạnh mẽ như đối thủ, nhưng lại sở hữu một chiến lược khác biệt: mã nguồn mở. Đứng sau sự trỗi dậy đó là Lương Văn Phong – người đang định nghĩa lại cuộc chơi trong lĩnh vực trí tuệ nhân tạo.

Lương Văn Phong, người sáng lập DeepSeek, không chọn cách đầu tư ồ ạt vào siêu máy tính hay phần cứng đắt đỏ. Ông tin rằng sức mạnh thực sự của AI nằm ở thuật toán và khả năng tối ưu hóa mô hình. Chính vì vậy, DeepSeek tập trung vào việc phát triển các mô hình ngôn ngữ lớn (LLM) với chi phí thấp nhưng hiệu quả cao, khiến cả giới công nghệ phải bất ngờ.

Trong vòng một năm, DeepSeek liên tục công bố những bước tiến mạnh mẽ. Tháng 11/2023, công ty ra mắt DeepSeek Coder, một mô hình AI hỗ trợ lập trình, đánh dấu bước khởi đầu trong cuộc cạnh tranh với OpenAI Codex và Google Gemini. Tiếp đó, tháng 12/2023, DeepSeek LLM chính thức xuất hiện, cho thấy tham vọng của startup này không chỉ dừng lại ở lập trình, mà còn hướng tới các ứng dụng AI tổng quát.

Bước ngoặt thực sự đến vào giữa năm 2024, khi DeepSeek giới thiệu mô hình thế hệ thứ hai – DeepSeek-V2. Với sự cải tiến mạnh mẽ về hiệu suất và tối ưu hóa chi phí, mô hình này nhanh chóng thu hút sự chú ý của cộng đồng AI toàn cầu. DeepSeek không chỉ cạnh tranh sòng phẳng với GPT-4 mà còn tạo ra áp lực lớn lên các đối thủ bằng chiến lược giá cả hợp lý.

Cuối năm 2024, DeepSeek tiếp tục khiến giới công nghệ sửng sốt khi ra mắt DeepSeek-V3 với 671 tỷ tham số và khả năng xử lý ngữ cảnh lên đến 128.000 mã thông báo – một bước nhảy vọt so với những gì OpenAI và Google đang sở hữu. Với phiên bản này, DeepSeek chứng minh rằng một công ty khởi nghiệp hoàn toàn có thể sánh ngang với những gã khổng lồ công nghệ, thậm chí còn làm tốt hơn trong một số lĩnh vực.

Điều làm nên sức hút của DeepSeek không chỉ là công nghệ, mà còn là mô hình kinh doanh đầy táo bạo. Thay vì khóa chặt công nghệ trong hệ sinh thái khép kín như OpenAI hay Google, DeepSeek chọn con đường mã nguồn mở, cho phép cộng đồng nhà phát triển trên toàn thế giới tham gia đóng góp và cải thiện mô hình. Chiến lược này giúp công ty nhanh chóng mở rộng phạm vi ảnh hưởng và thu hút được sự quan tâm của nhiều tổ chức công nghệ.

Tác động của DeepSeek không chỉ giới hạn trong phạm vi kỹ thuật. Sự xuất hiện của startup này đã khiến thị trường AI toàn cầu chao đảo. Các công ty phương Tây, vốn đã quen với cuộc chơi độc quyền, giờ đây phải đối mặt với một đối thủ không chỉ mạnh về công nghệ mà còn có giá thành rẻ hơn đáng kể. Thị trường chứng khoán cũng phản ứng dữ dội: cổ phiếu của Nvidia – công ty đang hưởng lợi lớn từ cơn sốt AI – bất ngờ giảm mạnh do lo ngại về sự thay đổi cán cân quyền lực trong ngành.

“Nước cờ” từ một kỹ sư đến “cha đẻ” DeepSeek

Sinh năm 1985 tại Quảng Đông, Trung Quốc, Lương Văn Phong tốt nghiệp cử nhân và thạc sĩ ngành kỹ thuật điện tử và thông tin tại Đại học Chiết Giang.

Sau khi tốt nghiệp, Lương Văn Phong đã thử sức mình trong nhiều lĩnh vực khác nhau. Ông tích lũy kinh nghiệm tại các công ty công nghệ như NetEase và Alibaba. Năm 2013, ông cùng bạn học đồng sáng lập Công ty TNHH Quản lý Đầu tư Jacobi Hàng Châu, đánh dấu bước chân vào lĩnh vực tài chính định lượng. Đến năm 2015, ông tiếp tục thành lập Công ty TNHH Công nghệ Hàng Châu Huanfang, chuyên về đầu tư định lượng thông qua toán học và trí tuệ nhân tạo.

Bước ngoặt quan trọng đến vào năm 2016, khi Lương Văn Phong cùng hai người bạn kỹ sư đồng sáng lập công ty High-Flyersử dụng sức mạnh của toán học và AI để tạo tiếng vang trong giới tài chính. Đến năm 2019, công ty đã quản lý khối tài sản hơn 10 tỷ nhân dân tệ. Cùng năm, ông thành lập High-Flyer AI, một bộ phận nghiên cứu chuyên sâu về thuật toán AI.

Nhận thấy tiềm năng của AI, từ năm 2021, Lương Văn Phong bắt đầu thu mua hàng nghìn GPU Nvidia, chuẩn bị cho việc phát triển các mô hình AI mạnh mẽ. “Nước cờ” này có ý nghĩa quan trọng. Khi chính phủ Mỹ siết chặt lệnh cấm vận chip đối với Trung Quốc, Lương Văn Phong đã nắm trong tay nguồn lực then chốt cho tham vọng AI của mình.

Tháng 4/2023, High-Flyer thành lập phòng thí nghiệm AI, tách biệt khỏi hoạt động tài chính. Đến tháng 5/2023, DeepSeek chính thức ra đời, đánh dấu sự chuyển hướng từ tài chính sang công nghệ của Lương Văn Phong.

Công thức thành công: Tối ưu hóa chi phí và hiệu quả

Một trong những yếu tố quan trọng dẫn đến thành công của DeepSeek là khả năng phát triển các mô hình AI mạnh mẽ với chi phí thấp hơn đáng kể so với các đối thủ. Theo báo cáo, DeepSeek chỉ tiêu tốn khoảng 5,576 triệu USD để phát triển mô hình DeepSeek-V3, nhờ vào chiến lược tối ưu hóa và sử dụng hiệu quả tài nguyên.

Lương Văn Phong và nhóm DeepSeek luôn ủng hộ cộng đồng mã nguồn mở, cho phép các nhà phát triển trên toàn thế giới truy cập và cải tiến mô hình của họ. Chiến lược này không chỉ thúc đẩy tiến bộ công nghệ mà còn tạo ra một hệ sinh thái hợp tác rộng lớn, giúp DeepSeek nhanh chóng cải thiện và mở rộng phạm vi ảnh hưởng.

Cùng với đó là tầm nhìn về đổi mới và đầu tư. Trong một phát biểu, Lương Văn Phong nhấn mạnh: "Đổi mới chắc chắn sẽ tốn kém, và xu hướng trước đây khi áp dụng công nghệ hiện có thường gắn với giai đoạn phát triển trước đó. Nhưng ngày nay, quy mô kinh tế của Trung Quốc và lợi nhuận của những gã khổng lồ như ByteDance và Tencent có ý nghĩa toàn cầu."

Ông tin rằng, với quy mô kinh tế và tiềm lực của các công ty công nghệ Trung Quốc, việc đầu tư vào đổi mới và công nghệ tiên tiến là hoàn toàn khả thi, tạo điều kiện cho DeepSeek cạnh tranh trên thị trường quốc tế.

Thành công của DeepSeek không chỉ đến từ công nghệ tiên tiến mà còn từ chiến lược kinh doanh thông minh và tầm nhìn dài hạn của Lương Văn Phong. Bằng cách tối ưu hóa chi phí, cam kết với cộng đồng mã nguồn mở và đầu tư vào đổi mới, DeepSeek đã tạo ra một mô hình kinh doanh độc đáo, thách thức các đối thủ lớn và định hình lại cuộc chơi trong lĩnh vực trí tuệ nhân tạo.

Tác động của DeepSeek không chỉ giới hạn trong phạm vi kỹ thuật. Sự xuất hiện của startup này đã khiến thị trường AI toàn cầu chao đảo. Các công ty phương Tây, vốn đã quen với cuộc chơi độc quyền, giờ đây phải đối mặt với một đối thủ không chỉ mạnh về công nghệ mà còn có giá thành rẻ hơn đáng kể. Thị trường chứng khoán cũng phản ứng dữ dội: cổ phiếu của Nvidia – công ty đang hưởng lợi lớn từ cơn sốt AI – bất ngờ giảm mạnh do lo ngại về sự thay đổi cán cân quyền lực trong ngành.

Nhưng hành trình của DeepSeek không chỉ có màu hồng. Việc công khai mã nguồn cũng đồng nghĩa với nguy cơ lạm dụng công nghệ, khiến công ty phải đối mặt với áp lực từ cả chính phủ lẫn cộng đồng. Bên cạnh đó, lệnh cấm vận công nghệ của Mỹ đối với Trung Quốc cũng đặt ra thách thức không nhỏ cho DeepSeek trong việc tiếp cận các bộ tăng tốc AI mạnh mẽ như GPU của Nvidia.

Tuy nhiên, với tốc độ phát triển ấn tượng và chiến lược linh hoạt, DeepSeek đang dần khẳng định vị thế của mình trên bản đồ AI toàn cầu. Nếu tiếp tục duy trì đà tăng trưởng này, rất có thể trong tương lai, startup non trẻ này sẽ trở thành đối trọng thực sự của những gã khổng lồ như OpenAI hay Google. Và khi đó, thế giới AI sẽ không còn là sân chơi độc quyền của phương Tây nữa.

Mai Nguyễn

Nguồn Tri Thức & Cuộc Sống: https://kienthuc.net.vn/khoa-hoc-cong-nghe/quai-kiet-luong-van-phong-cha-de-deepseek-khien-de-che-ai-ty-do-rung-dong-2078349.html