Google AI Edge Eloquent: Công nghệ nhập liệu giọng nói mới đe dọa vị thế của bàn phím

Ứng dụng AI Edge Eloquent mới của Google trên iOS cho phép chuyển giọng nói thành văn bản chuyên nghiệp, hoạt động offline và tự động loại bỏ các từ đệm dư thừa.

Google vừa chính thức ra mắt ứng dụng Google AI Edge Eloquent trên nền tảng iOS, đánh dấu một bước tiến mới trong việc thay đổi thói quen tương tác của người dùng với smartphone. Khác với các công cụ ghi âm thông thường, ứng dụng này có khả năng chuyển đổi giọng nói thành văn bản hoàn chỉnh ngay trên thiết bị mà không cần kết nối internet, đồng thời tự động biên tập nội dung để đạt độ mạch lạc như văn bản viết tay.

Cơ chế hoạt động và khả năng xử lý offline của Google AI Edge Eloquent

Trái tim của Google AI Edge Eloquent là các mô hình nhận dạng giọng nói Gemma, được tối ưu hóa để vận hành trực tiếp trên phần cứng của điện thoại. Điều này không chỉ đảm bảo tốc độ phản hồi theo thời gian thực mà còn giúp người dùng duy trì năng suất làm việc trong điều kiện không có mạng hoặc muốn bảo mật dữ liệu tuyệt đối.

Một trong những điểm đột phá nhất của ứng dụng là khả năng tự động xử lý hậu kỳ. Khi người dùng kết thúc câu nói, hệ thống AI sẽ ngay lập tức phân tích và loại bỏ các từ đệm phổ biến như “um”, “ah”, đồng thời điều chỉnh cấu trúc câu văn. Kết quả trả về không đơn thuần là một bản ghi chép thô mà là một đoạn văn bản đã được tinh chỉnh, chuyên nghiệp và dễ đọc.

Google ra mắt app nhập liệu bằng giọng nói, có thể thay thế bàn phím (Nguồn: Internet)

Google ra mắt app nhập liệu bằng giọng nói, có thể thay thế bàn phím (Nguồn: Internet)

Tích hợp AI Gemini để nâng cao chất lượng biên tập

Bên cạnh khả năng xử lý nội bộ, Google AI Edge Eloquent còn cung cấp tùy chọn kết nối đám mây để tận dụng sức mạnh của mô hình ngôn ngữ Gemini. Khi kích hoạt chế độ này, người dùng có thể thực hiện các tác vụ phức tạp hơn như:

Tóm tắt nội dung: Cô đọng các ý chính từ một đoạn hội thoại dài.
Điều chỉnh văn phong: Thay đổi giọng điệu văn bản từ thân mật sang trang trọng hoặc ngược lại.
Tối ưu độ dài: Kéo dài hoặc rút ngắn văn bản theo yêu cầu cụ thể mà vẫn giữ nguyên thông điệp chính.

Quyền riêng tư vẫn được ưu tiên hàng đầu khi Google cho phép người dùng linh hoạt lựa chọn giữa việc xử lý dữ liệu hoàn toàn trên thiết bị hoặc gửi lên đám mây để nhận được kết quả chuyên sâu hơn.

Cá nhân hóa và tiềm năng thay thế bàn phím truyền thống

Để tăng độ chính xác, ứng dụng hỗ trợ tính năng cá nhân hóa từ vựng. Người dùng có thể bổ sung các tên riêng, thuật ngữ chuyên ngành hoặc từ địa phương vào bộ nhớ của ứng dụng. Hệ thống cũng cung cấp một trình quản lý lịch sử thông minh, cho phép tìm kiếm nhanh các bản ghi cũ và theo dõi các số liệu thống kê như tốc độ nói trung bình hoặc tổng số từ đã thực hiện.

Mặc dù hiện tại mới chỉ xuất hiện trên iOS, nhưng các nguồn tin rò rỉ cho thấy phiên bản dành cho Android đang được phát triển với khả năng tích hợp sâu hơn vào hệ điều hành. Trong tương lai gần, Google AI Edge Eloquent có thể xuất hiện dưới dạng một nút nổi toàn hệ thống hoặc thậm chí thay thế hoàn toàn bàn phím mặc định, biến lời nói thành phương thức nhập liệu chính thay vì gõ phím như hiện nay.

Sự ra đời của ứng dụng này cho thấy AI không còn chỉ dừng lại ở việc hỗ trợ mà đang dần hiểu và tối ưu hóa nội dung theo ngữ cảnh thực tế của người dùng.

Tuệ Nhân

Nguồn Lâm Đồng: https://baolamdong.vn/google-ai-edge-eloquent-cong-nghe-nhap-lieu-giong-noi-moi-de-doa-vi-the-cua-ban-phim-436071.html