Thử nghiệm gây chấn động giới AI

Một nhà nghiên cứu AI đang gây chú ý với khả năng cho AI tự thử nghiệm, tối ưu mô hình, mở ra hướng nghiên cứu mới nhưng cũng dấy lên lo ngại cho cộng đồng.

2 giờ trướcGốc

Andrej Karpathy đang là nhà nghiên cứu tự do và nhà sáng lập Eureka Labs. Ảnh: The Information.

Andrej Karpathy, nhà nghiên cứu AI nổi tiếng từng làm từ những ngày đầu của OpenAI và sau đó tại Tesla, đang được chú ý trên X. Hiện tại, ông sở hữu 1,9 triệu người theo dõi trên X, với những phát ngôn về AI đầy uy tín, được xem như lời tiên tri.

Bài đăng đang lan truyền nói về thí nghiệm sử dụng một tác tử AI coding để chạy hàng loạt thử nghiệm nhằm tìm cách cải thiện quá trình huấn luyện một mô hình ngôn ngữ nhỏ. Ông để AI agent hoạt động liên tục trong hai ngày, đủ thời gian tiến hành 700 thử nghiệm khác nhau.

Qua các thử nghiệm này, hệ thống phát hiện ra 20 cách tối ưu giúp cải thiện thời gian huấn luyện. Kết quả trên được gọi là “autoresearch”, giúp tăng hiệu suất huấn luyện lên 11% khi áp dụng cho mô hình ngôn ngữ lớn hơn.

Tobias Lütke, CEO của Shopify, chia sẻ trên X mình đã thử dùng “autoresearch” để tối ưu một mô hình AI dựa trên dữ liệu nội bộ của công ty. Lütke cho biết sau khi để hệ thống chạy qua đêm đã thực hiện 37 thử nghiệm và mang lại mức tăng hiệu suất 19%.

Nhiều người chú ý đến “autoresearch” do gần giống với ý tưởng hệ thống AI tự cải thiện, một khái niệm chỉ có trong khoa học viễn tưởng. Trong khi một số nhà nghiên cứu khao khát hiện thực hóa, số khác lo ngại về viễn cảnh khi AI có thể tự nâng cấp.

Với khả năng trên, AI có thể liên tục tối ưu chính mã nguồn và quá trình huấn luyện của mình theo vòng lặp. Điều này có thể dẫn đến điều các nhà nghiên cứu an toàn AI gọi là bùng nổ trí tuệ (intelligence explosion), khi máy móc vượt qua khả năng nhận thức của con người và thoát khỏi sự kiểm soát.

Tuy nhiên, thí nghiệm của Andrej Karpathy chưa đạt đến mức đó. AI agent trong hệ thống “autoresearch” chỉ đang điều chỉnh mã huấn luyện và thiết lập ban đầu của một mô hình AI khác nhỏ và kém phức tạp hơn nhiều.

Hệ thống AI chưa đủ sức để tự hoàn thiện chính mình. Dù vậy, Karpathy cũng nhấn mạnh rằng thí nghiệm này có ý nghĩa lớn đối với cách các phòng lab AI làm nghiên cứu trong tương lai, và có thể góp phần tăng tốc đáng kể tiến trình phát triển của họ.

“Các phòng lab LLM hàng đầu rồi cũng sẽ làm điều này”, Andrej Karpathy viết trên X. Ông thừa nhận rằng ở quy mô lớn đòi hỏi nhiều công cụ, vì hệ thống của ông chỉ cần xử lý việc tinh chỉnh một mô hình và quy trình huấn luyện gói gọn trong 630 dòng code Python.

Karpathy nói thêm rằng thực hiện “autoresearch” chỉ cần đáp ứng yêu cầu kỹ thuật. “Bạn giao nhiệm vụ một bầy agent để chúng phối hợp và tinh chỉnh các mô hình nhỏ, sau đó đưa ý tưởng để thử nghiệm quy mô lớn hơn, và con người chỉ cần tham gia ở rìa”, ông viết.

Janakiram MSV, nhà phân tích chính tại Janakiram & Associates, chỉ ra rằng thành phần cốt lõi của “autoresearch” có thể được áp dụng cho nhiều hệ thống agent khác nhau. Ông xem bài viết của Karpathy như bản thực hành tốt nhất cho những ai làm việc với AI agent, với file hướng dẫn mô tả rõ ràng nhiệm vụ, ràng buộc, những điều agent không được làm, và điều kiện dừng.

Tuy nhiên, một số ý kiến chỉ trích cho rằng Karpathy thực chất chỉ tái phát hiện một phần của quy trình AutoML, vốn đã được các công ty như Google hay Microsoft sử dụng trong nhiều năm. AutoML cũng vận hành theo vòng lặp tối ưu và thực hiện hàng loạt thử nghiệm để tìm ra dữ liệu tốt nhất, kiến trúc mô hình phù hợp nhất, và cách tinh chỉnh tối ưu.

Andrej Karpathy phản bác những so sánh với AutoML, cho rằng các phương pháp cũ thực chất kém xa “autoresearch”. Theo ông, những hệ thống trước đây gần như không thể bằng một LLM có thể tự viết code, rút kinh nghiệm từ các thử nghiệm trước và thậm chí truy cập internet để tìm ý tưởng mới.

Nhật Tường

Nguồn Znews: https://znews.vn/thu-nghiem-gay-chan-dong-gioi-ai-post1637587.html

Tính năng mới của Gemini có thể thay đổi cuộc chơi AI

Google vừa đặt lại quy tắc cho toàn bộ ngành SEO

1 giờ

ByteDance, thế lực mới trên internet toàn cầu

Tin nóng

Thủ đô của Trung Quốc phê duyệt quy định mới về thiết bị bay không người lái

6 giờ

Mọi chuyến bay của thiết bị này tại Bắc Kinh phải xin cấp phép trước, khu vực bay chuyên dụng được thiết lập để phục vụ hoạt động đặc thù: nghiên cứu, giáo dục, thử nghiệm trong lĩnh vực công nghiệp.

LVMH bị điều tra liên quan đến trẻ em

6 giờ

Tập đoàn xa xỉ LVMH cùng Sephora và Benefit bị cơ quan Italy điều tra vì nghi sử dụng influencer nhỏ tuổi để thúc đẩy mua sắm mỹ phẩm ở trẻ vị thành niên.

Indonesia bắt đầu hạn chế trẻ dưới 16 tuổi dùng mạng xã hội

2 giờ

Indonesia bắt đầu thực hiện một quy định mới của Chính phủ, cấm trẻ em dưới 16 tuổi truy cập các nền tảng số có rủi ro cao.

Ngành học dự đoán 'lên ngôi' trong năm 2026, ra trường dễ có việc làm, luôn 'khát' nhân lực chất lượng cao

Chuyên trang Góc nhìn pháp lý - Tạp chí Người đưa tin

1 giờ

Đóng vai trò quan trọng trong các hoạt động sản xuất ở Việt Nam, ngành học này đã và đang đào tạo nhiều kỹ sư giỏi, đáp ứng nhu cầu ngày càng cao của các công ty, doanh nghiệp. Sinh viên học ngành này ra trường dễ kiếm việc, thu nhập ổn định vì thị trường luôn trong tình trạng 'khát' nhân lực.

Hà Tĩnh thí điểm du lịch thông minh đầu tiên cả nước

16 phút

Lần đầu tiên được lựa chọn thí điểm triển khai hệ sinh thái du lịch số cấp Quốc gia, Hà Tĩnh đang đứng trước cơ hội bứt phá mạnh mẽ, hứa hẹn tái định hình cách quản lý điểm đến và nâng cao trải nghiệm cho du khách.

Drone KUB-2-2E Nga thế hệ mới đầu đạn nhiệt áp, hủy diệt mục tiêu bằng AI

6 giờ

Drone KUB-2-2E không chỉ nâng cấp tầm bắn lên 40 km, mẫu drone cảm tử này còn sở hữu 'bộ não' AI tự động khóa mục tiêu và đầu đạn nhiệt áp sức công phá cực lớn, sẵn sàng thổi bay mọi công sự hay thiết bị bọc thép chỉ trong một cú lao mình chính xác.

Tin mới

Việt Nam – Vương quốc Anh chia sẻ kinh nghiệm trong chăm sóc y tế

Chuyên trang Phụ Nữ - Báo Người lao động

21 phút

Đoàn đại biểu y tế cấp cao Việt Nam vừa có chuyến thăm và làm việc tại Vương quốc Anh theo lời mời của Đại sứ quán Anh.

Indonesia chính thức cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội

1 giờ

Ngày 28-3, lệnh cấm sử dụng mạng xã hội đối với trẻ em dưới 16 tuổi tại Indonesia chính thức có hiệu lực.

Cần Thơ: Lần đầu tiên đưa máy xạ trị gia tốc tuyến tính Halcyon vào hệ thống y tế công lập

1 giờ

Ngày 28/3, Sở Y tế TP. Cần Thơ và Bệnh viện Ung bướu Cần Thơ tổ chức Lễ bàn giao hệ thống xạ trị gia tốc tại cơ sở I và khánh thành khu điều trị nội trú và khởi công khu xạ trị gia tốc tại cơ sở III.

Hợp tác thúc đẩy nâng cao chất lượng điều trị, chăm sóc người bệnh ung thư tại Việt Nam

2 giờ

Ung thư vẫn là một trong những thách thức y tế cộng đồng mang tính cấp bách tại Việt Nam. Theo GLOBOCAN, năm 2022, Việt Nam ghi nhận khoảng 180.480 ca mắc mới và 120.184 ca tử vong do ung thư. Những con số này chỉ ra nhu cầu cấp thiết trong việc nâng cao chất lượng chẩn đoán sớm, tăng cường điều trị đa khoa...

Hành khách hưởng lợi công nghệ số từ Hanoi Metro

2 giờ

Thống kê cho thấy, lượng khách sử dụng đường sắt đô thị tăng mạnh nhờ Hà Nội Metro triển khai nhiều ứng dụng công nghệ trong hoạt động vận tải, trong đó có hệ thống soát vé tự động, ứng dụng định danh sinh trắc học và thanh toán không dùng tiền mặt.

Ngọc hóa - xu hướng an táng văn minh và triển vọng tại Việt Nam

2 giờ

Sáng 28.3 tại Hội trường Nhà khách Văn phòng Trung ương Đảng (số 8 Chu Văn An, Hà Nội), Viện Kinh tế và Pháp luật quốc tế thuộc Liên hiệp các Hội Khoa học và Kỹ thuật Việt Nam tổ chức hội thảo khoa học với chủ đề 'Ngọc hóa - xu hướng an táng văn minh và triển vọng tại Việt Nam'. Sự kiện quy tụ đông đảo chuyên gia, nhà khoa học và nhà quản lý, cùng bàn luận về một hướng tiếp cận mới trong lĩnh vực tang lễ: chuyển hóa tro cốt thành tinh thể dạng ngọc.

Tin công nghệ 28-3: Cuộc đua cấu hình trên smartphone đã hết thời?

2 giờ

Tin công nghệ 28-3 sẽ có các nội dung như Cuộc đua cấu hình trên smartphone đã hết thời? Vì sao OpenAI lại 'khai tử' Sora? Dell đặt cược vào AI và thiết kế mỏng nhẹ.

Áo phê duyệt kế hoạch cấm trẻ em sử dụng mạng xã hội

2 giờ

Ngày 27/3/2026, Chính phủ Áo cho biết sẽ kết hợp lệnh cấm mạng xã hội đối với trẻ em dưới 14 tuổi tại nước này với nỗ lực tăng cường kiến thức về sử dụng phương tiện truyền thông và trí tuệ nhân tạo (AI) ở các trường THPT, bắt đầu từ năm học tới.