Giới nghiên cứu thành công sao chép công nghệ mới của OpenAI chỉ trong... 24 giờ
Hugging Face thông báo đã thành công tạo ra công cụ AI mã nguồn mở, tương tự với tính năng Nghiên cứu sâu mới nhất của OpenAI chỉ trong vòng 24 giờ…
![Tính năng mới nhất của OpenAI bị “chưng cất” trong vòng 24 giờ.](https://photo-baomoi.bmcdn.me/w700_r1/2025_02_12_3_51455472/4972ec69da2733796a36.jpg)
Tính năng mới nhất của OpenAI bị “chưng cất” trong vòng 24 giờ.
OpenAI, công ty do CEO Sam Altman lãnh đạo phát hành tính năng Nghiên cứu sâu (Deep Research) vào cuối tuần trước. Công cụ "sử dụng khả năng lý luận để tổng hợp lượng thông tin khổng lồ trên mạng và hoàn thành nhiệm vụ nghiên cứu nhiều bước cho người dùng", theo Yahoo Tech.
Nói theo cách đơn giản, Deep Research là tính năng mới, hiện đã có sẵn trong nền tảng mô hình AI. Thực tế, người dùng có thể yêu cầu công cụ thực hiện một số công việc như "phân tích tính cạnh tranh trên các nền tảng streaming hoặc báo cáo cá nhân hóa về chiếc xe đạp tốt nhất dành cho người đi làm", theo OpenAI, sau "từ năm đến 30 phút", bạn sẽ có câu trả lời.
Sau ngày ra mắt đó, các nhà nghiên cứu đến từ Hugging Face, công ty công nghệ chuyên phát triển AI của Hoa Kỳ, không mất nhiều thời gian để tìm ra giải pháp thay thế xứng đáng.
"Trong khi các mô hình ngôn ngữ lớn (LLM) hiện có sẵn và miễn phí dưới dạng mã nguồn mở, OpenAI không tiết lộ nhiều về cấu trúc cơ bản của Deep Research", Hugging Face viết trong thông cáo báo chí. "Vì vậy, chúng tôi quyết định thực hiện sao chép kết quả của họ và đồng thời mở mã nguồn cấu trúc cần thiết".
Công ty đã tạo ra "khung tác vụ" (agent framework) viết hành động dưới dạng mã và ngay lập tức hiệu suất được nâng cao đáng kể.
Tuy nhiên, vẫn còn một số điểm cần cải thiện. Chỉ số chính xác của Open Deep Research từ Hugging Face đạt 55,15% trong bài kiểm tra General AI Assistants, trong khi phiên bản của OpenAI đạt 67,36%. (Dẫu vậy, phiên bản gốc của OpenAI gặp khó khăn trong việc phân biệt "thông tin giả mạo", điều này làm giảm giá trị sử dụng của một công cụ chuyên phân tích, nghiên cứu).
DỄ DÀNG SAO CHÉP
Mặc dù Hugging Face có ít nguồn lực hơn so với OpenAI, nhưng họ tạo ra công cụ AI của riêng mình chỉ trong 24 giờ. Thử thách này chứng minh mức độ khắc nghiệt và dễ dàng bị thay thế trong lĩnh vực công nghệ. Mỗi khi OpenAI ra mắt công nghệ AI mới, dường như luôn có “làn sóng” sẵn sàng sao chép những thành tựu mới chỉ với một phần nhỏ nguồn lực.
Trong khi trưởng nhóm nghiên cứu Hugging Face, Aymeric Roucher, cho biết công cụ của họ "hoạt động tốt" so với o1 của OpenAI, ông cũng nói rằng mô hình mã nguồn mở của Hugging Face, open-R1, có thể hoạt động "tốt hơn" trong thời gian tới.
Khả năng thay thế mô hình AI là chủ đề rất nóng hiện nay, nhất là khi DeepSeek của Trung Quốc xuất hiện và làm thay đổi toàn bộ ngành công nghệ với mô hình cực kỳ tinh gọn và hiệu quả mang tên R1, xuất hiện hồi vào tháng trước. (Open-R1 của Hugging Face là phiên bản mã nguồn mở của mô hình DeepSeek).
DeepSeek cũng có thể sử dụng phương pháp "chưng cất" (distillation), tức là tạo ra khả năng "lý luận" bằng cách huấn luyện mô hình AI dựa trên kết quả của một mô hình khác. Liệu việc này có vi phạm quyền sở hữu trí tuệ hay không?, điều mà OpenAI cáo buộc DeepSeek, hiện vẫn chưa có kết quả cuối cùng. Tuy vậy, nhiều người đánh giá OpenAI cũng được xây dựng bằng cách sao chép tùy tiện nội dung có bản quyền trên internet.
Đây là cách tiếp cận thông minh, khiến những "ông lớn" trong ngành AI như OpenAI phải dè chừng. Ngoài ra, các nhà nghiên cứu tại Đại học Stanford và Đại học Washington đã phát triển một sản phẩm xứng tầm với mô hình "lý luận" o1 của OpenAI chỉ với chưa đầy 50 USD chi phí điện toán đám mây, theo TechCrunch.
Mô hình mới này có tên là s1, hoạt động ở mức tương đương với R1 của DeepSeek và o1 của OpenAI trong các bài kiểm tra toán học và lập trình. Mô hình được "chưng cất" bằng cách sử dụng kết quả từ mô hình lý luận Gemini 2.0 Flash Thinking Experimental của Google, mô hình này chủ yếu miễn phí cho người dùng.
Nhóm nghiên cứu huấn luyện s1 với bộ dữ liệu chỉ gồm 1.000 câu hỏi chọn lọc và câu trả lời từ AI của Google. Chưa đầy 30 phút, mô hình có được hiệu suất mạnh mẽ trong bài kiểm tra AI, cùng 16 chip AI Nvidia.
Trong khi đó, những ông lớn trong ngành như OpenAI và Meta lên kế hoạch đầu tư hàng trăm tỷ USD vào sáng kiến mở rộng cơ sở hạ tầng AI tại Hoa Kỳ, những khoản đầu tư khổng lồ này đang bị đặt dấu hỏi khi có sự xuất hiện của các đối thủ thay thế giá rẻ như DeepSeek.
Chưa nói đến việc ngừng phản hồi thông tin sai lệch, liệu các công cụ này có thể tạo ra lợi nhuận hay không? Đây là câu hỏi chưa có câu trả lời - đặc biệt là khi những "mô hình nhỏ" có thể nhanh chóng sao chép thành tựu công nghệ và cung cấp dịch vụ miễn phí.