Người giúp tạo ra ChatGPT lập startup bí ẩn, có cựu CTO OpenAI hậu thuẫn
Từng giúp tạo nên ChatGPT, Angela Jiang vừa thành lập startup (công ty khởi nghiệp) mới có tên Worktrace AI với sự hậu thuẫn của Mira Murati.
Worktrace AI tập trung vào việc cung cấp giải pháp AI (trí tuệ nhân tạo) cho các doanh nghiệp lớn, giống với Thinking Machines Lab của Mira Murati, cựu giám đốc công nghệ (CTO) OpenAI.

Mira Murati đầu tư vốn vào Worktrace AI - Ảnh: Getty Images
Theo thông tin mà trang Insider thu thập được, Worktrace AI đã tham gia các cuộc đàm phán vào mùa hè này để huy động 10 triệu USD trong vòng gọi vốn hạt giống, với mức định giá 50 triệu USD.
Worktrace AI hiện có trang web và tài khoản LinkedIn, nhưng chưa đưa ra bất kỳ thông báo chính thức nào về việc ra mắt. Angela Jiang từ chối bình luận về việc này. Trong khi đồng sáng lập Worktrace AI là Deepak Vasisht, trợ lý giáo sư khoa học máy tính tại Đại học Illinois, không phản hồi khi được đề nghị bình luận.
Worktrace AI giúp các doanh nghiệp phát hiện và tự động hóa những công việc lặp lại bằng cách quan sát nhân viên, theo thông tin trên website của công ty. Đây là một phần trong xu hướng mới nổi tại Thung lũng Silicon, khi các công ty tìm cách để AI học hỏi và tái tạo lại hành vi, thao tác của con người. Ví dụ, tháng trước OpenAI đã công bố các phương pháp mới để đo lường hiệu suất của mô hình AI trên những nhiệm vụ thực tế, chẳng hạn viết bản tóm tắt pháp lý.
Worktrace AI đã thu hút nguồn vốn từ nhiều nhân vật chủ chốt của OpenAI, gồm cả Nick Turley (trưởng bộ phận ChatGPT), Jason Kwon (giám đốc chiến lược OpenAI) và Joanne Jang (người dẫn dắt nhóm chịu trách nhiệm định hình hành vi của ChatGPT), theo trang Insider.
Ngoài ra, Worktrace AI còn nhận được vốn từ quỹ khởi nghiệp của OpenAI, cùng các công ty đầu tư mạo hiểm như 8VC và Conviction.
Angela Jiang là quản lý sản phẩm thứ ba của OpenAI và từng góp phần ra mắt các mô hình AI nền tảng cho ChatGPT, gồm cả phiên bản GPT-3.5 gây sốt cuối năm 2022. Sau đó, Angela Jiang chuyển sang nhóm chính sách công của OpenAI trước khi rời công ty vào tháng 12.2024, theo hồ sơ LinkedIn cá nhân của cô.

Angela Jiang từng giúp tạo nên ChatGPT, hiện là đồng sáng lập Worktrace AI - Ảnh: Internet
Làn sóng startup do người cũ OpenAI sáng lập
Worktrace AI là một trong nhiều startup AI do cựu nhân viên OpenAI sáng lập gần đây, phần lớn trong số đó đã huy động được nguồn vốn lớn ngay cả trước khi ra mắt sản phẩm hay có doanh thu.
Theo trang Insider, Thinking Machines Lab của Mira Murati đã hoàn thành vòng gọi vốn hạt giống trị giá 2 tỉ USD trong năm nay và hiện được định giá 12 tỉ USD. Trong khi đó, Safe Superintelligence, công ty khởi nghiệp do Ilya Sutskever (cựu nhà khoa học trưởng của OpenAI) sáng lập, có mức định giá 32 tỉ USD, theo trang FT.
Tháng 9, Periodic Labs, startup được đồng sáng lập bởi William Fedus (một trong những nhà nghiên cứu giúp tạo ra ChatGPT), đã huy động 300 triệu USD trong vòng gọi vốn để xây dựng "các nhà khoa học AI".
Sản phẩm AI đầu tiên của Thinking Machines Lab tạo đột phá
Đầu tháng 10, Thinking Machines Lab đã giới thiệu sản phẩm đầu tiên của mình có tên Tinker, giúp tự động hóa quá trình tạo ra các mô hình AI tiên tiến tùy chỉnh.
"Chúng tôi tin rằng Tinker sẽ giúp các nhà nghiên cứu và nhà phát triển thử nghiệm mô hình, giúp mọi người dễ dàng tiếp cận hơn các khả năng AI tiên tiến", Mira Murati, đồng sáng lập kiêm Giám đốc điều hành Thinking Machines Lab cho biết.
Các công ty lớn và phòng thí nghiệm học thuật đã tinh chỉnh mô hình AI mã nguồn mở để tạo ra những biến thể mới được tối ưu hóa cho từng nhiệm vụ cụ thể, chẳng hạn giải toán, soạn thảo thỏa thuận pháp lý hoặc trả lời câu hỏi y tế.
Thông thường, công việc này liên quan đến việc mua và quản lý các cụm GPU (bộ xử lý đồ họa), sử dụng nhiều phần mềm khác nhau để đảm bảo các đợt huấn luyện quy mô lớn diễn ra ổn định và hiệu quả. Tinker hứa hẹn sẽ giúp nhiều doanh nghiệp, nhà nghiên cứu và thậm chí cả những người đam mê AI tinh chỉnh các mô hình riêng bằng cách tự động hóa phần lớn quy trình này.
Về cơ bản, Thinking Machines Lab đang đặt cược rằng việc giúp mọi người tinh chỉnh các mô hình tiên tiến sẽ là bước tiến lớn tiếp theo trong lĩnh vực AI và có lý do để tin họ có thể đúng.
Thinking Machines Lab được điều hành bởi các nhà nghiên cứu từng đóng vai trò cốt lõi trong việc tạo ra ChatGPT. Tinker mạnh mẽ và thân thiện với người dùng hơn so với các công cụ tương tự trên thị trường, những người dùng bản beta tiết lộ với tạp chí Wired.
Mira Murati cho biết mục tiêu của Thinking Machines Lab là làm sáng tỏ công việc phức tạp đằng sau việc tinh chỉnh các mô hình mạnh nhất thế giới, giúp nhiều người hơn có thể khám phá những giới hạn bên ngoài của AI.
"Chúng tôi đang làm cho những gì vốn là khả năng tiên tiến trở nên dễ tiếp cận với mọi người và điều đó thực sự là cuộc cách mạng. Có rất nhiều người thông minh ngoài kia và chúng ta cần càng nhiều nhân tài càng tốt để thực hiện nghiên cứu AI tiên tiến", Mira Murati nói.
Hiện tại, Tinker cho phép người dùng tinh chỉnh hai dòng mô hình AI mã nguồn mở: Llama của Meta Platforms và Qwen của Alibaba. Người dùng chỉ cần viết vài dòng mã để truy cập vào API (giao diện lập trình ứng dụng) của Tinker và bắt đầu tinh chỉnh bằng phương pháp học có giám sát (điều chỉnh mô hình AI bằng dữ liệu được gán nhãn) hoặc học tăng cường (phương pháp ngày càng phổ biến giúp cải thiện mô hình thông qua phản hồi tích cực hoặc tiêu cực dựa trên kết quả đầu ra). Sau khi hoàn tất, người dùng có thể tải xuống mô hình AI đã tinh chỉnh và triển khai ở bất kỳ đâu.
Ngành công nghiệp AI đang theo dõi sát sao màn ra mắt Tinker, một phần là do trình độ của đội ngũ đằng sau nó.
Mira Murati trước đây là CTO OpenAI. Bà từng giữ chức vụ Giám đốc điều hành (CEO) OpenAI trong một thời gian ngắn khi hội đồng quản trị sa thải Sam Altman vào tháng 11.2023 nhưng phục chức cho ông chỉ vài ngày sau đó. Đến tháng 9.2024, Mira Murati tuyên bố rời OpenAI.
Không lâu sau, Mira Murati đồng sáng lập Thinking Machines Lab cùng một số cựu chuyên gia OpenAI, gồm John Schulman (đồng sáng lập); Barret Zoph (cựu phó chủ tịch nghiên cứu); Lilian Weng (nghiên cứu an toàn và robot); Andrew Tulloch (phụ trách tiền huấn luyện và khả năng suy luận của mô hình AI); Luke Metz (chuyên gia huấn luyện mô hình).
Thinking Machines Lab đã thu hút rất nhiều sự chú ý ngay cả khi chưa công bố bất kỳ sản phẩm nào. Vào tháng 7, Thinking Machines Lab tiết lộ đã huy động được 2 tỉ USD trong vòng gọi vốn hạt giống, đưa startup này lên mức định giá đáng kinh ngạc là 12 tỉ USD.
Khi còn ở OpenAI, John Schulman từng dẫn đầu việc tinh chỉnh mô hình ngôn ngữ lớn làm nền tảng cho ChatGPT bằng phương pháp học tăng cường. Theo ông, phản hồi của người kiểm tra đóng vai trò như tín hiệu thưởng, giúp mô hình AI duy trì các cuộc trò chuyện mạch lạc, trả lời chính xác hơn không bị lạc hướng và giảm thiểu hành vi sai lệch.
John Schulman tuyên bố Tinker sẽ giúp nhiều người dễ dàng khám phá khả năng mới của các mô hình ngôn ngữ lớn thông qua học tăng cường và những kỹ thuật huấn luyện khác.
"Có rất nhiều điều kỳ diệu bí mật, nhưng chúng tôi trao cho mọi người toàn quyền kiểm soát vòng lặp huấn luyện. Chúng tôi che giấu phần phức tạp của huấn luyện phân tán, nhưng vẫn trao cho người dùng toàn quyền kiểm soát dữ liệu và các thuật toán", John Schulman nói với Wired.
Thinking Machines Lab sẽ bắt đầu nhận đơn đăng ký sử dụng Tinker từ ngày 8.10. Hiện công ty chưa thu phí API, nhưng dự kiến sẽ làm vậy trong tương lai.
API Tinker đã được cung cấp cho một số người dùng thử, gồm cả Eric Gan, nhà nghiên cứu tại Redwood Research - tổ chức nghiên cứu phi lợi nhuận tập trung vào việc nghiên cứu an toàn và rủi ro của AI tiên tiến. Eric Gan cho biết đang sử dụng tính năng học tăng cường của Tinker để tinh chỉnh mô hình AI nhằm phát hiện cửa hậu trong mã máy tính.
Eric Gan nói Tinker giúp ông có thể khai thác các khả năng từ một mô hình AI mà việc sử dụng API thông thường không thể làm được. Ông đánh giá việc điều chỉnh các tham số trong quá trình tinh chỉnh mô hình AI trên Tinker tương đối dễ dàng
“Tinker chắc chắn mang đến cách đơn giản hơn rất nhiều so với việc thực hiện học tăng cường từ đầu. Học tăng cường đặc biệt tốt nếu bạn có một tác vụ rất chuyên biệt mà các mô hình hiện tại chưa làm được”, Eric Gan nhận xét.
Một người khác thử nghiệm Tinker là Robert Nishihara, Giám đốc điều hành Anyscale - hãng cung cấp công nghệ quản lý các dự án AI quy mô lớn.
Robert Nishihara nói rằng trong khi các công cụ tinh chỉnh khác như VERL và SkyRL đã tồn tại, Tinker mang lại sự kết hợp độc đáo giữa tính trừu tượng và khả năng tùy chỉnh mô hình AI sâu. “Tôi nghĩ đây là API tuyệt vời và sẽ có rất nhiều người muốn dùng nó”, ông nói.
Nỗi lo ngại dai dẳng xung quanh các mô hình AI mã nguồn mở là chúng có thể bị tải xuống và sửa đổi theo những cách bất chính. Thinking Machines Lab đang kiểm tra kỹ những người được cấp quyền truy cập API của mình và John Schulman nói công ty cuối cùng sẽ giới thiệu các hệ thống tự động để ngăn chặn việc sử dụng sai mục đích.
Tinker là sản phẩm đầu tiên của Thinking Machines Lab, nhưng công ty đã công bố các nghiên cứu cơ bản về huấn luyện mô hình, gồm cả những tiến bộ trong việc duy trì hiệu suất của mạng nơ-ron và tinh chỉnh mô hình ngôn ngữ lớn hiệu quả hơn.
Mạng nơ-ron là mô hình tính toán trong lĩnh vực AI, được lấy cảm hứng từ cách bộ não con người hoạt động.
Kế hoạch mở rộng quy trình tinh chỉnh các mô hình ngôn ngữ lớn của Thinking Machines Lab cũng cho thấy cam kết về tính cởi mở, vào thời điểm hầu hết công ty AI tại Mỹ giữ các mô hình tốt nhất ở trạng thái đóng và chỉ có thể truy cập thông qua API. Trung Quốc hiện có nhiều mô hình AI tiên tiến nguồn mở hơn Mỹ, đang được nhiều công ty và nhà nghiên cứu trên khắp thế giới sử dụng.
Mira Murati hy vọng Tinker sẽ góp phần đảo ngược xu hướng thương mại hóa mô hình AI ngày càng khép kín.
“Nếu nhìn vào những gì đang được làm trong các phòng thí nghiệm tiên phong và những gì người thông minh trong giới học thuật theo đuổi, bạn sẽ thấy hai bên ngày càng tách biệt. Điều đó thật không tốt nếu bạn nghĩ về cách mà những hệ thống mạnh mẽ đang được đưa vào thế giới”, cô nói.