Nga tự hào vì 'thuộc 7 nước sở hữu mô hình AI riêng, có quyền lực ngang công nghệ hạt nhân'

'AI giống như một dự án hạt nhân', lãnh đạo Sberbank - ngân hàng lớn nhất Nga đang chuyển mình thành tập đoàn công nghệ tập trung vào AI - phát biểu.

AI (trí tuệ nhân tạo) sẽ trao cho những quốc gia đi trước hiện nay mức độ ảnh hưởng ngang với công nghệ hạt nhân, giúp họ vượt trội trong thế kỷ này, theo Alexander Vedyakhin, Phó tổng giám đốc thứ nhất của Sberbank.

Alexander Vedyakhin nói với hãng tin Reuters rằng việc Nga nằm trong số 7 nước có mô hình AI tự phát triển là điều đáng tự hào.

"AI giống như một dự án hạt nhân. Một 'câu lạc bộ hạt nhân' mới đang nổi lên trên toàn cầu, nơi bạn có mô hình ngôn ngữ lớn quốc gia của riêng mình hoặc không có", Alexander Vedyakhin phát biểu trong cuộc phỏng vấn tại sự kiện Hành trình AI thường niên của Nga.

Ông cho rằng Nga phải có ít nhất 2 hoặc 3 mô hình AI tự phát triển, không phải “mô hình nước ngoài được huấn luyện lại”, để sử dụng trong các lĩnh vực nhạy cảm như dịch vụ công trực tuyến, y tế và giáo dục.

“Không thể tải thông tin mật vào một mô hình AI nước ngoài. Điều đó hoàn toàn bị cấm. Làm như vậy sẽ dẫn đến những hậu quả rất khó chịu”, Alexander Vedyakhin bình luận.

Tổng thống Vladimir Putin tuần trước cũng nói rằng các mô hình AI nội địa có vai trò sống còn với việc bảo vệ chủ quyền Nga. Sberbank và hãng công nghệ Yandex đang dẫn đầu các nỗ lực của Nga nhằm thu hẹp khoảng cách với Mỹ và Trung Quốc.

Alexander Vedyakhin thừa nhận Nga sẽ gặp khó khăn trong việc bắt kịp các quốc gia dẫn đầu về năng lực điện toán, đặc biệt do các lệnh trừng phạt từ phương Tây hạn chế khả năng tiếp cận công nghệ, và khoảng cách này nhiều khả năng sẽ còn nới rộng.

Alexander Vedyakhin phát biểu trong cuộc phỏng vấn với Reuters tại văn phòng của ông ở Moscow, thủ đô Nga - Ảnh: Reuters

Alexander Vedyakhin phát biểu trong cuộc phỏng vấn với Reuters tại văn phòng của ông ở Moscow, thủ đô Nga - Ảnh: Reuters

“Thành viên câu lạc bộ AI không còn chỗ trống”

Alexander Vedyakhin cho biết Mỹ và Trung Quốc đang dẫn trước phần còn lại của “câu lạc bộ”, gồm cả Nga, khoảng 6 đến 9 tháng. Theo ông, “cánh cửa gia nhập câu lạc bộ” coi như đã đóng. Điều này đồng nghĩa các quốc gia chưa bắt đầu phát triển mô hình AI riêng gần như không thể gia nhập câu lạc bộ này?!

“Trong cuộc đua đó, mỗi ngày đều quan trọng. Thế nhưng, những ai chưa bắt đầu thì mỗi ngày trôi qua lại bị tụt lại nhiều hơn một ngày so với nhóm dẫn đầu. Với những nước quyết định tham gia ngay lúc này, chi phí sẽ cực kỳ lớn, gần như không thể”, Alexander Vedyakhin nhận định.

“Chúng tôi đánh giá cao những gì các công ty Trung Quốc và Mỹ đã làm. Chúng tôi hiểu họ có lợi thế lớn với rất nhiều tiền, chuyên gia và năng lực điện toán”, ông nói thêm.

Alexander Vedyakhin cho biết mô hình GigaChat 2 MAX của Sberbank có thể so sánh với GPT 4.0 do OpenAI (Mỹ) phát triển, còn GigaChat Ultra Preview ngang bằng GPT 5.0.

Sberbank đang chuẩn bị cho cuộc cạnh tranh với các thế hệ mô hình AI kế tiếp và có kế hoạch mở mã nguồn một số mô hình mới nhất, gồm cả sử dụng thương mại.

“Nga không bị ảnh hưởng bởi bong bóng AI”

Alexander Vedyakhin nói Nga sẽ dựa vào đội ngũ lập trình viên, nhà toán học để cắt giảm chi phí và tăng tốc học máy, đồng thời khẳng định: “Những gì chúng tôi không thể đạt được chỉ bằng số lượng, chúng tôi sẽ đạt được bằng kỹ năng”.

Học máy là lĩnh vực thuộc AI, tập trung vào việc nghiên cứu và phát triển các kỹ thuật cho phép hệ thống máy tính học tự động từ dữ liệu để giải quyết các vấn đề cụ thể, mà không cần phải được lập trình tường minh cho từng tác vụ.

Tuy nhiên, phát triển AI đòi hỏi vốn đầu tư khổng lồ. Ông ước tính ngành điện của Nga cần 40.000 tỉ rúp (506 tỉ USD) cho sản xuất điện và 5.000 tỉ rúp cho lưới điện trong 16 năm tới.

Một bước nhảy vọt về bộ nhớ của các mô hình ngôn ngữ lớn và sự xuất hiện của kiến trúc AI không dựa trên công nghệ Transformer được huấn luyện trước (GPT) có thể là đột phá tiếp theo, tương tự những gì DeepSeek (Trung Quốc) làm năm 2024.

Alexander Vedyakhin cảnh báo mức tiêu thụ năng lượng khổng lồ khiến lợi nhuận kiếm được từ đầu tư vào AI “rất xa vời, hoặc gần như không thấy được”, đồng thời nhấn mạnh cần tránh sự thổi phồng quá mức trong chi tiêu hạ tầng.

“Chúng tôi tin rằng nếu đầu tư quá nhiều vào hạ tầng AI thực sự có thể không thu hồi được vốn, xét về tốc độ phát triển công nghệ quá nhanh”, Alexander Vedyakhin cho biết.

Ông nói thêm rằng Nga không bị ảnh hưởng bởi bong bóng AI vì khoản đầu tư của họ không quá mức.

GigaChat 2 MAX và GigaChat Ultra có gì hay?

Sberbank phát triển hai mô hình chủ lực là GigaChat 2 MAX và GigaChat Ultra, thuộc hai thế hệ hoàn toàn khác nhau. GigaChat 2 MAX nằm trong dòng GigaChat 2.0, vốn là bản nâng cấp quan trọng giúp mô hình xử lý ngôn ngữ tốt hơn, cải thiện độ hiểu ngữ cảnh, tính ổn định và khả năng lập trình. Đây là mô hình được Sberbank tối ưu để trở thành lựa chọn đa dụng, phù hợp cho nhiều tác vụ từ viết văn bản, phân tích dữ liệu đến xây dựng chatbot phục vụ doanh nghiệp.

Trong khi đó, GigaChat Ultra thuộc họ GigaChat 3.0, được Sberbank mô tả như mô hình AI cực lớn của họ. Phiên bản GigaChat Ultra Preview sử dụng kiến trúc MoE (tổ hợp các chuyên gia), mỗi chuyên gia đảm nhiệm một phần nhiệm vụ khác nhau. Nhờ kiến trúc này, GigaChat Ultra có tổng quy mô khổng lồ khoảng 702 tỉ tham số, nhưng khi chạy thực tế, mô hình chỉ kích hoạt khoảng 36 tỉ tham số cho mỗi token, giúp giảm đáng kể chi phí tính toán mà vẫn giữ được chất lượng đầu ra. Kiến trúc MoE cũng cho phép GigaChat Ultra linh hoạt hơn trong việc xử lý các nhiệm vụ phức tạp, đồng thời tránh việc phải kích hoạt toàn bộ tham số như các mô hình dense truyền thống.

So với GigaChat Ultra, GigaChat 2 MAX nhỏ hơn đáng kể, nhưng vẫn đủ mạnh cho phần lớn tác vụ trong môi trường doanh nghiệp. Sberbank nhấn mạnh rằng GigaChat 2 MAX được tối ưu hóa sâu và đặc biệt hiệu quả khi xử lý các bài toán khó hoặc tải lớn, nhờ cải tiến về huấn luyện và thuật toán tối ưu.

Ở khía cạnh chất lượng, Sberbank cho biết GigaChat Ultra vượt trội khi đánh giá bằng các bộ đo chuẩn cho tiếng Nga. Theo tiêu chuẩn đánh giá MERA của Nga, GigaChat Ultra Preview vượt DeepSeek V3.1. Dù quy mô 702 tỉ tham số, GigaChat Ultra Preview trong nhiều thử nghiệm vẫn cho thời gian phản hồi nhanh hơn GigaChat 2 MAX, nhờ kiến trúc MoE tối ưu.

Một điểm khác biệt lớn là mức độ mở. GigaChat Ultra Preview được Sberbank phát hành dưới dạng trọng số mở theo giấy phép MIT. Điều này cho phép các doanh nghiệp tải mô hình về triển khai trong hệ thống của họ, tùy chỉnh theo nhu cầu riêng, đặc biệt hữu ích trong bối cảnh Nga nhấn mạnh việc bảo vệ dữ liệu nhạy cảm và hạn chế sử dụng mô hình nước ngoài. Triển khai cài đặt tại chỗ cũng giúp các tổ chức tránh phụ thuộc vào dịch vụ đám mây bên ngoài và kiểm soát chi phí lâu dài.

Về ứng dụng, GigaChat Ultra được định vị là mô hình phục vụ các dự án chất lượng cao, yêu cầu độ chính xác lớn, khả năng lập luận sâu và hiệu năng ổn định ở quy mô lớn. Ngược lại, Sberbank cũng phát triển các mô hình nhẹ hơn trong hệ sinh thái GigaChat, chẳng hạn GigaChat Lightning, được thiết kế để chạy nhanh trên laptop hoặc máy chủ nhỏ, cho phép doanh nghiệp linh hoạt hơn khi chọn công cụ AI.

Sberbank cho biết đang chuẩn bị một phiên bản GigaChat Ultra dành riêng cho doanh nghiệp, tối ưu theo chi phí sở hữu tổng thể và phù hợp với môi trường triển khai nội bộ. Trong khi đó, GigaChat 2 MAX vẫn được xem là lựa chọn kinh tế, dễ tích hợp và mang lại hiệu suất cao cho đa số tác vụ xử lý ngôn ngữ tự nhiên, phân tích, nghiên cứu và lập trình.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/nga-tu-hao-vi-thuoc-7-nuoc-so-huu-mo-hinh-ai-rieng-co-quyen-luc-ngang-cong-nghe-hat-nhan-241460.html