Tại sao Mỹ khó ngăn chặn DeepSeek 'chưng cất' mô hình AI?

7 giờ trướcGốc

Các cố vấn hàng đầu của Nhà Trắng vừa bày tỏ lo ngại rằng DeepSeek của Trung Quốc có thể đã hưởng lợi từ các mô hình AI của Mỹ nhờ phương pháp 'chưng cất'.

Mô hình AI học hỏi từ mô hình AI khác

Theo các nguồn tin từ giám đốc điều hành và nhà đầu tư tại Thung lũng Silicon, kỹ thuật này - trong đó một hệ thống AI học hỏi từ một hệ thống AI khác, có thể rất khó để ngăn chặn.

Các cố vấn của Nhà Trắng nghi ngờ DeepSeek đã học hỏi các mô hình AI của Mỹ bằng kỹ thuật "chưng cất".

Gần đây, DeepSeek đã làm rung chuyển ngành công nghệ với một mô hình AI mới dường như có khả năng cạnh tranh với các công ty khổng lồ của Mỹ như OpenAI, nhưng với chi phí thấp hơn nhiều. Đặc biệt, công ty có trụ sở tại Hàng Châu, Chiết Giang (Trung Quốc) đã cung cấp ứng dụng miễn phí.

Một số chuyên gia công nghệ tin rằng mô hình của DeepSeek có thể đã học hỏi từ các mô hình của Hoa Kỳ để đạt được một số tiện ích. Kỹ thuật chưng cất bao gồm việc thiết lập một mô hình AI, đánh giá chất lượng các câu trả lời từ một mô hình AI mới hơn, trên thực tế là chuyển giao các bài học của mô hình cũ hơn.

Điều đó có nghĩa là mô hình mới hơn có thể gặt hái được lợi ích từ các khoản đầu tư lớn về thời gian và sức mạnh tính toán đã bỏ ra để xây dựng mô hình ban đầu mà không phải chịu các chi phí liên quan.

Hình thức "chưng cất" này, khác với cách mà hầu hết các nhà nghiên cứu học thuật trước đây sử dụng từ này, là một kỹ thuật phổ biến được sử dụng trong lĩnh vực AI. Tuy nhiên, nó vi phạm các điều khoản dịch vụ của một số mô hình nổi bật do các công ty công nghệ Hoa Kỳ đưa ra trong những năm gần đây, bao gồm cả OpenAI.

Nhà sản xuất ChatGPT nói họ biết về các nhóm ở Trung Quốc đang tích cực làm việc để sao chép các mô hình AI của Mỹ thông qua "chưng cất" và đang xem xét liệu DeepSeek có thể đã "chưng cất" các mô hình của mình hay không.

Phó chủ tịch AI tại Databricks, Naveen Rao cho biết, việc học hỏi từ các đối thủ là "điều bình thường" trong ngành AI. Ông Rao ví điều này giống như cách các nhà sản xuất ô tô mua rồi kiểm tra động cơ của nhau.

"Công bằng mà nói, điều này xảy ra trong mọi tình huống. Cạnh tranh là có thật và bạn sẽ trích xuất thông tin đó rồi điều chỉnh theo cách của mình", ông Rao nhận định.

Howard Lutnick, ứng cử viên cho chức Bộ trưởng Thương mại dưới thời Tổng thống Donald Trump - người sẽ giám sát các biện pháp kiểm soát xuất khẩu trong tương lai đối với công nghệ AI, đã nói với Thượng viện Hoa Kỳ trong phiên điều trần vào thứ Tư rằng có vẻ như DeepSeek đã chiếm dụng công nghệ AI của Hoa Kỳ và tuyên bố sẽ áp đặt các hạn chế.

"Tôi không tin rằng DeepSeek đã thực hiện một cách minh bạch. Điều đó thật vô lý. Chúng tôi sẽ nghiêm ngặt trong việc theo đuổi các hạn chế và thực thi các hạn chế đó để chúng ta luôn dẫn đầu", ông Lutnick nói.

David Sacks, chuyên gia AI và tiền điện tử của Nhà Trắng, cũng nêu lên những lo ngại về khả năng "chưng cất" của DeepSeek trong một cuộc phỏng vấn với Fox News vào hôm thứ Ba.

Khó có thể ngăn chặn việc "chưng cất" mô hình AI

Quan ngại của Washington về việc Trung Quốc sử dụng các sản phẩm của Hoa Kỳ để thúc đẩy lĩnh vực công nghệ tương tự như những lo ngại trước đây về ngành công nghiệp bán dẫn, nơi Hoa Kỳ đã áp đặt các hạn chế đối với loại chip và công cụ sản xuất có thể được vận chuyển đến Trung Quốc và đang xem xét việc hạn chế trên một số công nghệ mở.

Ứng cử viên chức Bộ trưởng Thương mại Mỹ dưới thời Tổng thống Donald Trump, Howard Lutnick tuyên bố sẽ áp đặt các hạn chế đối với doanh nghiệp công nghệ Trung Quốc.

Các nhà công nghệ cho biết việc chặn "chưng cất" khó hơn so với vẻ bề ngoài của nó. Một trong những đổi mới của DeepSeek cho thấy một số lượng mẫu dữ liệu tương đối nhỏ - ít hơn một triệu - từ một mô hình lớn hơn, có thể cải thiện đáng kể khả năng của một mô hình nhỏ hơn.

Khi các sản phẩm phổ biến như ChatGPT với hàng trăm triệu người dùng, một lượng lưu lượng truy cập nhỏ có thể khó phát hiện - và một số mô hình, chẳng hạn như Llama của Meta Platforms và các sản phẩm của công ty khởi nghiệp Pháp Mistral, có thể được tải xuống miễn phí và sử dụng trong các trung tâm dữ liệu riêng, có nghĩa là việc vi phạm các điều khoản dịch vụ của họ có thể khó phát hiện.

"Không thể ngăn chặn việc "chưng cất" mô hình khi bạn có các mô hình nguồn mở như Mistral và Llama. Chúng có sẵn cho tất cả mọi người. Họ cũng có thể tìm thấy mô hình của OpenAI ở đâu đó thông qua khách hàng", Umesh Padval, Giám đốc điều hành tại Thomvest Ventures cho biết.

Một nguồn tin quen thuộc với chủ đề trên tại phòng thí nghiệm AI lớn cho biết cách duy nhất để ngăn các công ty như DeepSeek "chưng cất" các mô hình của Hoa Kỳ là các yêu cầu "nhận biết khách hàng của bạn" nghiêm ngặt, tương tự như cách các công ty tài chính xác định họ đang kinh doanh với ai.

Tuy nhiên, nguồn tin này cho biết chưa có gì chắc chắn. Chính quyền của cựu Tổng thống Joe Biden đã đưa ra các yêu cầu như vậy, nhưng Tổng thống Donald Trump có thể không tán thành.

Giám đốc điều hành của Groq, Jonathan Ross - một công ty điện toán AI lưu trữ các mô hình AI trên đám mây, đã thực hiện bước chặn tất cả các địa chỉ IP của Trung Quốc truy cập vào đám mây để ngăn các công ty nước này bị cáo buộc lợi dụng các mô hình AI mà họ lưu trữ.

"Điều đó là không đủ, bởi vì mọi người có thể tìm cách lách luật. Chúng tôi có những ý tưởng cho phép ngăn chặn điều đó và đó sẽ là một trò chơi mèo vờn chuột... Tôi không biết giải pháp là gì. Nếu ai tìm ra nó, hãy cho chúng tôi biết", ông Ross nói.

(Nguồn Reuters)

Đức Bình

Nguồn Giao Thông: https://www.baogiaothong.vn/tai-sao-my-kho-ngan-chan-deepseek-chung-cat-mo-hinh-ai-19225013014203997.htm