Các công ty AI đang tìm kiếm lợi nhuận lớn từ các 'mô hình ngôn ngữ nhỏ'

20/5/2024 Gốc

Các công ty trí tuệ nhân tạo (AI) đã chi hàng tỷ đô la để xây dựng cái gọi là 'mô hình ngôn ngữ lớn - LLM', song cũng đang tìm cách tăng doanh thu bằng 'mô hình ngôn ngữ nhỏ'.

Apple, Microsoft, Meta và Google gần đây đều đã phát hành các mô hình AI mới với ít “tham số” hơn nhưng vẫn có khả năng mạnh mẽ. Động thái này là nỗ lực của các nhóm công nghệ nhằm khuyến khích các doanh nghiệp hạn chế về tài chính vẫn có thể sử dụng AI.

Ảnh minh họa: FT

Nói chung, số lượng tham số càng cao thì hiệu suất của phần mềm AI càng tốt và các nhiệm vụ của nó càng phức tạp và nhiều sắc thái hơn. Mẫu GPT-4o mới nhất của OpenAI và Gemini 1.5 Pro của Google, cả hai đều được công bố trong tuần này, được ước tính có hơn 1 nghìn tỷ tham số. Trong khi đó, Meta đang đào tạo phiên bản 400 tỷ tham số của mô hình Llama nguồn mở của mình.

Những lo ngại về dữ liệu và trách nhiệm bản quyền cũng khiến các công ty công nghệ lớn (Big Tech) như Meta và Google phát hành các mô hình ngôn ngữ nhỏ chỉ với vài tỷ tham số rẻ tiền hơn, tiết kiệm năng lượng, có thể tùy chỉnh, cần ít năng lượng hơn để đào tạo và chạy, đồng thời cũng có thể ngăn chặn dữ liệu nhạy cảm.

Eric Boyd cho biết: “Bằng cách đạt được chất lượng cao như vậy với mức chi phí thấp hơn, bạn thực sự sẽ có nhiều ứng dụng hơn để khách hàng truy cập...”, phó chủ tịch công ty phụ trách Nền tảng AI Azure của Microsoft, nơi bán các mô hình AI cho các doanh nghiệp, cho biết.

Google , Meta, Microsoft và công ty khởi nghiệp Mistral của Pháp cũng đã phát hành các mô hình ngôn ngữ nhỏ, nhưng vẫn thể hiện khả năng tiến bộ và có thể tập trung tốt hơn vào các công việc cụ thể.

Nick Clegg, chủ tịch phụ trách các vấn đề toàn cầu của Meta, cho biết mô hình tham số 8 tỷ mới của Llama 3 có thể so sánh với GPT-4. Microsoft cho biết mô hình Phi-3 nhỏ của họ, với 7 tỷ tham số, hoạt động tốt hơn GPT-3.5, phiên bản trước đó của mô hình OpenAI.

Các mô hình nhỏ còn có thể xử lý các tác vụ cục bộ trên thiết bị thay vì gửi thông tin lên đám mây, điều này có thể thu hút những khách hàng quan tâm đến quyền riêng tư muốn đảm bảo thông tin được lưu giữ trong mạng nội bộ.

Charlotte Marshall, một quản lý tại công ty luật Addleshaw Goddard, nói rằng “một trong những thách thức mà tôi nghĩ nhiều khách hàng của chúng tôi đã gặp phải” khi áp dụng các sản phẩm AI tạo sinh là tuân thủ các yêu cầu pháp lý về xử lý và truyền dữ liệu. Bà cho biết các mô hình nhỏ hơn mang lại “cơ hội cho các doanh nghiệp vượt qua” những lo ngại về pháp lý và chi phí.

Các mẫu nhỏ hơn cũng cho phép các tính năng AI chạy trên các thiết bị như điện thoại di động. Mẫu “Gemini Nano” của Google được nhúng bên trong điện thoại Pixel mới nhất và điện thoại thông minh S24 mới nhất của Samsung.

Apple cũng đã tiết lộ rằng họ cũng đang phát triển các mô hình AI để chạy trên chiếc iPhone bán chạy nhất của mình. Tháng trước, gã khổng lồ Thung lũng Silicon này đã phát hành mô hình OpenELM, một mô hình nhỏ được thiết kế để thực hiện các tác vụ dựa trên văn bản.

Boyd của Microsoft cho biết các mẫu máy nhỏ hơn sẽ dẫn đến “các ứng dụng thú vị, cho đến điện thoại và máy tính xách tay”.

Giám đốc OpenAI Sam Altman cho biết vào tháng 11 rằng họ cũng đã cấp các mô hình AI có quy mô khác nhau cho khách hàng và “phục vụ các mục đích riêng biệt”. Ông nói: “Có một số điều mà các mô hình nhỏ hơn sẽ hoạt động thực sự tốt. Tôi rất vui mừng vì điều đó”.

Tuy nhiên, Altman cho biết thêm OpenAI sẽ vẫn tập trung vào việc xây dựng các mô hình AI lớn hơn với khả năng mở rộng quy mô, bao gồm khả năng suy luận, lập kế hoạch và thực hiện các nhiệm vụ và cuối cùng đạt được trí thông minh ở cấp độ con người.

Hoàng Hải (theo FT)

Nguồn Công Luận: https://congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html