Ra mắt AI dịch hội thoại trực tiếp hơn 70 ngôn ngữ
Theo Google, công nghệ mới có khả năng tự động nhận diện hơn 70 ngôn ngữ và thực hiện dịch giọng nói gần như ngay lập tức, đồng thời giữ được ngữ điệu, tốc độ nói và cao độ giọng của người dùng.
Google ngày 10/6 đã công bố mô hình trí tuệ nhân tạo (AI) mới mang tên Gemini 3.5 Live Translate, cho phép dịch giọng nói theo thời gian thực giữa hơn 70 ngôn ngữ, mở ra triển vọng thay đổi cách con người giao tiếp và làm việc trong môi trường đa ngôn ngữ.
Theo thông báo của Google, công nghệ mới có khả năng tự động nhận diện hơn 70 ngôn ngữ và thực hiện dịch giọng nói gần như ngay lập tức, đồng thời giữ được ngữ điệu, tốc độ nói và cao độ giọng của người dùng.
Đây được xem là bước tiến đáng kể so với các hệ thống dịch truyền thống vốn thường phải chờ người nói kết thúc câu mới bắt đầu chuyển ngữ.
Điểm nổi bật của Gemini 3.5 Live Translate là khả năng tạo bản dịch liên tục trong khi người dùng đang nói, giúp các cuộc trò chuyện diễn ra tự nhiên và liền mạch hơn.
Google đã trình diễn công nghệ này thông qua nhiều tình huống thực tế như lồng tiếng video theo thời gian thực, dịch các bài giảng đa ngôn ngữ và hỗ trợ giao tiếp trực tiếp giữa những người sử dụng các ngôn ngữ khác nhau.
Trong nỗ lực mở rộng ứng dụng của công nghệ, Google cho biết Gemini 3.5 Live Translate sẽ được tích hợp vào nền tảng họp trực tuyến Google Meet trong năm nay.
Khi đó, số ngôn ngữ hỗ trợ dịch trực tiếp trên nền tảng này sẽ tăng từ 5 lên hơn 70 ngôn ngữ, cho phép tạo ra hơn 2.000 tổ hợp dịch khác nhau trong cùng một cuộc họp.
Đáng chú ý, hệ thống mới không còn phụ thuộc vào tiếng Anh như ngôn ngữ trung gian trong quá trình dịch thuật, qua đó giúp nâng cao độ chính xác và giảm độ trễ khi chuyển đổi giữa các ngôn ngữ.
Google cũng cho biết sẽ nâng cấp giao diện Google Meet để người dùng có thể truy cập tính năng dịch giọng nói nhanh hơn. Phiên bản thử nghiệm đầu tiên sẽ được triển khai cho một số doanh nghiệp sử dụng dịch vụ Google Workspace ngay trong tháng này, trước khi mở rộng tới nhiều khách hàng hơn vào cuối năm.
Song song với đó, Gemini 3.5 Live Translate đã bắt đầu được phát hành trên toàn cầu thông qua ứng dụng Google Translate dành cho Android và iOS. Bản cập nhật mới bổ sung chế độ "Listening Mode" trên Android, cho phép người dùng nghe phụ đề dịch trực tiếp qua tai nghe hoặc loa điện thoại.
Để hạn chế nguy cơ lạm dụng công nghệ AI, Google cho biết mọi đoạn âm thanh do Gemini 3.5 Live Translate tạo ra đều được gắn watermark kỹ thuật số vô hình bằng công nghệ SynthID.
Công cụ này giúp xác thực nội dung được tạo bởi AI và hỗ trợ ngăn chặn việc sử dụng sai mục đích, đặc biệt trong bối cảnh các lo ngại về thông tin giả mạo ngày càng gia tăng./.











