Mô hình gpt-oss của OpenAI sắp được Quân đội Mỹ sử dụng dù bị chê chưa đủ trình
Hai mô hình trọng số mở gpt-oss của OpenAI đang được thử nghiệm trên các hệ thống quân sự nhạy cảm của Mỹ, nhưng một số người trong giới quốc phòng cho rằng chúng vẫn tụt lại so với đối thủ.
Khi OpenAI công bố hai mô hình trọng số mở đầu tiên sau nhiều năm (kể tư 2019) vào tháng 8 vừa qua, không chỉ các hãng công nghệ chú ý mà cả Quân đội Mỹ và nhà thầu quốc phòng cũng hào hứng, bởi nhìn thấy cơ hội sử dụng chúng cho hoạt động có độ bảo mật cao.
gpt-oss có hai phiên bản là gpt-oss-120b (117 tỉ tham số, có thể chạy trên một GPU 80GB tiêu chuẩn) và gpt-oss-20b (21 tỉ tham số, chỉ cần GPU 16GB để vận hành), phù hợp cho các thiết bị cục bộ.
OpenAI cho biết gpt-oss-120b và gpt-oss-20b có hiệu năng tương đương mô hình suy luận độc quyền o3-mini và o4-mini, vượt trội về khả năng lập trình, giải toán thi đấu và các truy vấn liên quan đến y tế.
Theo OpenAI, gpt-oss-120b và gpt-oss-20b được huấn luyện trên tập dữ liệu chỉ gồm văn bản, ngoài kiến thức tổng quát thì còn tập trung vào khoa học, toán học và lập trình.
Các trọng số đã được huấn luyện trong gpt-oss là công khai, cho phép nhà phát triển tải xuống công khai, sử dụng để phân tích và tinh chỉnh mô hình cho những tác vụ cụ thể mà không cần dữ liệu huấn luyện gốc.

Hai mô hình trọng số mở của OpenAI ra mắt vào tháng 8 vừa qua
Greg Brockman, đồng sáng lập kiêm Chủ tịch OpenAI, cho biết: "Một trong những điều độc đáo về các mô hình trọng số mở là mọi người có thể chạy chúng cục bộ. Mọi người có thể chạy chúng đằng sau tường lửa và trên cơ sở hạ tầng của chính họ".
Mô hình ngôn ngữ trọng số mở khác với mô hình mã nguồn mở, vốn cho phép truy cập toàn bộ mã nguồn, dữ liệu huấn luyện và phương pháp huấn luyện.
"gpt-oss kém các đối thủ ở một số năng lực mong muốn"
Một số nhà cung cấp cho Quân đội Mỹ nói với tạp chí Wired rằng gpt-oss hiện vẫn kém các đối thủ ở một số năng lực mong muốn. Tuy vậy, họ vẫn hài lòng khi cuối cùng cũng có thể dùng mô hình từ một công ty hàng đầu trong lĩnh vực AI.
Lilt, công ty dịch thuật AI, hiện ký hợp đồng với Quân đội Mỹ để phân tích thông tin tình báo nước ngoài. Do phần mềm của Lilt xử lý dữ liệu mật nên phải được cài trực tiếp trên máy chủ chính phủ và hoạt động mà không cần kết nối internet. Trước đây, Lilt tự phát triển mô hình AI riêng hoặc dùng các mô hình mã nguồn mở như Llama của Meta Platforms hay Google Gemma. Các mô hình AI của OpenAI từng bị Lilt loại trừ vì là mã nguồn đóng và chỉ có thể truy cập trực tuyến.
gpt-oss-120b và gpt-oss-20b của OpenAI đã thay đổi điều đó. Cả hai có thể chạy cục bộ, nghĩa là người dùng được phép cài đặt và vận hành chúng trên thiết bị riêng mà không cần kết nối đám mây. Việc được truy cập vào trọng số của mô hình AI (những tham số then chốt quyết định cách mô hình phản ứng trước từng gợi lệnh) cho phép người dùng tùy chỉnh cho mục đích cụ thể.
Việc OpenAI quay lại thị trường mở có thể thúc đẩy cạnh tranh và tạo ra những hệ thống mạnh mẽ hơn cho quân đội, công ty chăm sóc sức khỏe và các bên khác làm việc với dữ liệu nhạy cảm. Một khảo sát gần đây của McKinsey trên khoảng 700 lãnh đạo doanh nghiệp cho thấy hơn 50% tổ chức đã dùng công nghệ AI mã nguồn mở. Mỗi mô hình có điểm mạnh riêng dựa vào cách huấn luyện và nhiều tổ chức thường kết hợp cả mô hình trọng số mở để tăng độ tin cậy trong các tình huống đa dạng.
McKinsey là công ty tư vấn quản lý toàn cầu có trụ sở chính tại thành phố New York, Mỹ. Đây là một trong ba ông lớn trong ngành tư vấn chiến lược cùng với Boston Consulting Group và Bain & Company, thường được gọi chung là nhóm Big Three.
Doug Matty, Giám đốc kỹ thuật số và AI của Bộ Quốc phòng Mỹ, nói rằng Lầu Năm Góc đang có kế hoạch tích hợp AI tạo sinh vào cả các hệ thống chiến trường lẫn nghiệp vụ hậu cần như kiểm toán. Một số ứng dụng này sẽ cần mô hình AI không phụ thuộc vào đám mây. “Năng lực của chúng tôi phải linh hoạt và dễ thích ứng”, Doug Matty nói.
OpenAI từ chối bình luận về việc các mô hình trọng số mở của mình sẽ được ngành quốc phòng sử dụng như thế nào. Năm ngoái, “cha đẻ ChatGPT” đã dỡ bỏ lệnh cấm toàn diện trước đây về việc sử dụng công nghệ của mình cho mục đích quân sự. Đây là động thái vấp phải chỉ trích từ các nhà hoạt động lo ngại rủi ro đạo đức về AI.
Với OpenAI, việc cung cấp mô hình trọng số mở miễn phí có thể mang lại nhiều lợi ích, giúp thu hút cộng đồng chuyên gia rộng hơn và cho phép các tổ chức sử dụng mà không cần đăng ký làm khách hàng chính thức. Từ đó, OpenAI tránh phải đối mặt với những lời chỉ trích về các khách hàng có khả năng gây tranh cãi, chẳng hạn Quân đội Mỹ.
Đầu năm nay, đơn vị của Doug Matty tại Bộ Quốc phòng Mỹ đã ký các hợp đồng kéo dài một năm, trị giá tới 200 triệu USD mỗi bên với OpenAI, xAI, Anthropic và Google. Mục tiêu là phát triển nguyên mẫu các hệ thống AI cho nhiều mục đích, gồm cả tự động hóa công cụ tác chiến. Trước khi OpenAI tung ra gpt-oss, chỉ có Google là đối tác công nghệ mới duy nhất cung cấp mô hình mở tiên tiến cho Bộ Quốc phòng Mỹ. Các công ty khác chỉ cấp phép mô hình AI vận hành trên đám mây và không thể tùy chỉnh sâu như mô hình mở.

Bộ Quốc phòng Mỹ ký hợp đồng 1 năm trị giá tới 200 triệu USD với OpenAI hồi tháng 6
Trong trường hợp của Lilt, Giám đốc điều hành Spence Green cho biết một nhà phân tích quân sự có thể nhập một câu lệnh như “Hãy dịch những tài liệu này sang tiếng Anh thật chính xác, rồi nhờ chuyên gia am hiểu nhất về siêu thanh kiểm tra lại”. Mô hình độc quyền của Lilt, được huấn luyện riêng cho các ứng dụng chính phủ, sẽ đảm nhiệm việc dịch, còn Google Gemma tự động định tuyến thông tin đến mô hình, nhà phân tích hoặc các nhóm khác. Mục tiêu là giải quyết tình trạng thiếu chuyên gia ngôn ngữ và tồn đọng dữ liệu lớn.
Tuy nhiên, gpt-oss không thực sự phù hợp với nhu cầu của Lilt do chỉ xử lý văn bản. Trong khi Quân đội Mỹ cần phải phân loại cả hình ảnh và âm thanh. Ngoài ra, Lilt nhận thấy gpt-oss kém hiệu quả ở một số ngôn ngữ và khi chạy trên thiết bị có tài nguyên hạn chế. Dẫu vậy, Spence Green vẫn lạc quan: “Hiện nay có rất nhiều đối thủ cạnh tranh với gpt-oss. Càng nhiều lựa chọn càng tốt”.
Một số công ty khác hợp tác với Quân đội Mỹ nói đã thu được kết quả khả quan khi thử nghiệm gpt-oss, dù chưa có dự án nào của Lầu Năm Góc vượt quá giai đoạn trình diễn thử nghiệm. “Vẫn còn khá sớm”, Jordan Wiens, đồng sáng lập Vector 35, cho hay.
Vector 35 là công ty cung cấp công cụ phân tích đảo ngược cho Quân đội Mỹ và đã tích hợp gpt-oss vào sản phẩm của mình.
Phân tích đảo ngược là quá trình tìm hiểu cách một hệ thống, thiết bị hoặc phần mềm hoạt động bằng cách tháo rời, phân tích hoặc dịch ngược nó, thay vì đọc tài liệu thiết kế gốc.
Lục quân và Không quân Mỹ sắp sử dụng gpt-oss
EdgeRunner AI, công ty đang phát triển trợ lý ảo cho Quân đội Mỹ hoạt động mà không cần đám mây, tiết lộ đã đạt hiệu suất đủ tốt với gpt-oss sau khi huấn luyện lại bằng kho tài liệu quân sự nội bộ, theo bài nghiên cứu công bố tháng 10. Lục quân và Không quân Mỹ sẽ bắt đầu thử nghiệm mô hình này trong tháng 11, Tyler Saltsman (Giám đốc điều hành EdgeRunner AI) tiết lộ.
Các mô hình mở đặc biệt hữu ích trong tình huống cần phản ứng tức thời hoặc khi có nguy cơ bị gián đoạn internet, chẳng hạn hệ thống AI trên drone hoặc vệ tinh, theo Kyle Miller - nhà phân tích tại Trung tâm Công nghệ và An ninh mới nổi thuộc Đại học Georgetown. Ông nói các mô hình AI mã nguồn mở mang lại cho quân đội “mức độ truy cập, kiểm soát, tùy chỉnh và bảo mật mà mô hình mã nguồn đóng không thể có được”.
Ngoài các hợp đồng trực tiếp, Quân đội Mỹ hiện cũng có thể truy cập khoảng 125 mô hình mã nguồn mở và 25 mô hình mã nguồn đóng thông qua nền tảng trung gian Ask Sage, theo Nicolas Chaillan, người sáng lập nền tảng này và cựu giám đốc phần mềm của Không quân và Lực lượng Không gian Mỹ.
Tuy nhiên, Nicolas Chaillan cảnh báo rằng việc dùng mô hình mở có nhiều rủi ro, đặc biệt với Quân đội Mỹ. Ông cho biết chúng dễ ảo giác (đưa thông tin sai y như thật) và dự đoán sai hơn các mô hình thương mại hàng đầu. Dù miễn phí, chi phí hạ tầng để vận hành các mô hình mở lớn nhất đôi khi còn cao hơn cả thuê mô hình đám mây thương mại. Ông so sánh: “Giống như đi từ trình độ tiến sĩ xuống con khỉ. Nếu bạn chi nhiều tiền hơn và nhận được một mô hình kém hơn, điều đó sẽ vô nghĩa”.
Nicolas Chaillan cho biết Quân đội Mỹ nên chú ý đến mô hình mở, nhưng tập trung vào các mô hình mạnh hơn được cung cấp qua nền tảng đám mây bảo mật của Microsoft, Amazon và Google, vốn được thiết kế riêng cho dữ liệu chính phủ.
Tuy nhiên, các nhà cung cấp và chuyên gia quân sự khác không đồng tình với Nicolas Chaillan khi cho rằng mô hình mã nguồn đóng có thể dẫn đến vấn đề phụ thuộc và sẽ không đáp ứng được nhu cầu chuyên biệt của quân đội.
Pete Warden, người điều hành hãng phát triển công nghệ chuyển giọng nói và dịch thuật Moonshine, nói nhiều đối tác quốc phòng đã trở nên thận trọng với các tập đoàn công nghệ lớn sau khi chứng kiến cách Elon Musk sử dụng mạng vệ tinh Starlink để gây ảnh hưởng chính trị.
“Sự độc lập khỏi nhà cung cấp là yếu tố then chốt”, Pete Warden nói. Moonshine hiện cho phép các cơ quan chính phủ sở hữu vĩnh viễn một bản sao mô hình của mình chỉ với một khoản phí duy nhất.
William Marcellino, nhà phát triển ứng dụng AI tại tổ chức nghiên cứu RAND Corporation, cho rằng mô hình mở dễ kiểm soát hơn sẽ giúp quân đội và các cơ quan tình báo thực hiện các dự án như dịch tài liệu tuyên truyền sang các phương ngữ địa phương. Đây là nhiệm vụ mà các mô hình thương mại có thể gặp khó khăn để thực hiện một cách chính xác. “Thật tốt khi có nhiều lựa chọn”, ông nói.
RAND Corporation là viện nghiên cứu chiến lược và chính sách phi lợi nhuận của Mỹ, được thành lập năm 1948. Ban đầu, RAND Corporation ra đời nhằm hỗ trợ Không quân Mỹ trong việc nghiên cứu và hoạch định chiến lược quốc phòng sau Thế chiến II, nhưng sau đó phạm vi nghiên cứu mở rộng ra nhiều lĩnh vực như an ninh quốc gia, công nghệ, y tế, giáo dục, năng lượng và kinh tế toàn cầu.
Với đội ngũ chuyên gia gồm các kỹ sư, nhà khoa học, kinh tế học và chuyên viên chính sách, RAND Corporation đóng vai trò quan trọng trong việc cung cấp dữ liệu, phân tích và khuyến nghị cho chính phủ Mỹ và các tổ chức quốc tế. Các nghiên cứu của RAND Corporation thường có ảnh hưởng lớn đến chính sách quân sự, công nghiệp quốc phòng và chiến lược an ninh toàn cầu.
Nói cách khác, RAND Corporation là “bộ não chiến lược” giúp hoạch định các quyết sách lớn của Mỹ, đặc biệt trong lĩnh vực quốc phòng và công nghệ quân sự.













