Google vừa ra mắt công cụ AI Edge Eloquent, một ứng dụng nhập liệu giọng nói miễn phí trên iOS với khả năng xử lý dữ liệu ngay trên thiết bị.
Google vừa âm thầm tung ra một ứng dụng iOS mới vào ngày hôm nay mà không qua bất kỳ một thông báo chính thức nào. Ứng dụng này được 9to5Google phát hiện đầu tiên với tên gọi Google AI Edge Eloquent. Đây là một công cụ nhập liệu giọng nói hoạt động thoải mái cả khi ngoại tuyến, cho phép chuyển lời nói thành văn bản trong thời gian thực, tự động loại bỏ các thành phần thừa và trả về đoạn văn bản chỉn chu. Google Eloquent hoàn toàn miễn phí, không yêu cầu đăng ký thuê bao hay giới hạn mức sử dụng.

Google AI Edge Eloquent hoạt động như thế nào?
Bạn chỉ cần mở ứng dụng, nhấn nút ghi âm và bắt đầu nói. Ứng dụng sẽ theo dõi giọng nói của bạn trong khi văn bản chuyển ngữ xuất hiện trên màn hình theo thời gian thực. Khi bạn dừng lại, ứng dụng sẽ tự động xử lý mọi thứ.

Các từ thừa như “ừm”, “à” sẽ biến mất, những lỗi diễn đạt giữa câu được làm mượt, và kết quả cuối cùng cho ra một đoạn văn bản dễ đọc và sẽ được sao chép trực tiếp vào bộ nhớ tạm trên máy. Ngoài ra, ứng dụng còn có 04 công cụ biến đổi văn bản cung cấp cho bạn quyền kiểm soát sâu hơn:
- Key points (Ý chính): Tóm tắt nội dung vừa nói thành các ý chính dưới dạng danh sách gạch đầu dòng.
- Formal (Trang trọng): Viết lại văn bản với tông giọng chuyên nghiệp hơn.
- Short (Ngắn gọn): Cô đọng nội dung vào những phần thiết yếu nhất.
- Long (Chi tiết): Mở rộng văn bản khi bạn cần thêm chi tiết.
Ứng dụng cũng có mục lịch sử để lưu trữ tất cả các bản chuyển đổi trước đó cùng với số liệu thống kê như tổng số từ và tốc độ nói.
Ứng dụng Google Eloquent có lưu trữ dữ liệu giọng nói của người dùng không?
Khác với hầu hết các ứng dụng nhập liệu miễn phí, Google AI Edge Eloquent giữ dữ liệu giọng nói của bạn hoàn toàn riêng tư. Một nút gạt ở góc trên cùng cho phép bạn chuyển đổi giữa hai chế độ. Ở chế độ ngoại tuyến hoàn toàn, mọi âm thanh đều nằm lại trên thiết bị và được xử lý cục bộ bằng các mô hình nhận dạng giọng nói dựa trên Gemma và không có dữ liệu nào được gửi lên máy chủ.

Ở chế độ đám mây, việc nhận dạng giọng nói vẫn bắt đầu trên thiết bị, nhưng các mô hình Gemini sẽ đảm nhận việc tinh chỉnh văn bản trên đám mây. Đối với bất kỳ ai làm công việc nhạy cảm về quyền riêng tư hoặc không thoải mái với việc tải dữ liệu giọng nói lên mạng, tùy chọn xử lý cục bộ là một tính năng cực kỳ hữu ích.
Ứng dụng cũng bao gồm một từ điển cá nhân, nơi bạn có thể thêm tên riêng, thuật ngữ kỹ thuật và biệt ngữ để cải thiện độ chính xác. Bạn cũng có thể đăng nhập bằng tài khoản Google để ứng dụng tự động lấy các từ thường xuyên sử dụng từ hòm thư Gmail gần đây.
Google AI Edge Eloquent: Một trong những lựa chọn miễn phí tốt nhất thay thế các app trả phí năm 2026
Hai trong số những ứng dụng tương tự nổi bật nhất hiện nay là Wispr Flow và Willow đều có mức phí 15 USD mỗi tháng. Cả hai đều dựa trên đám mây và truyền âm thanh của bạn qua các máy chủ từ xa. Trong khi đó, SuperWhisper chạy mọi thứ cục bộ để bảo mật tốt hơn, nhưng lại có giá 85 USD mỗi năm. Google Eloquent đánh bại cả ba về giá cả trong khi vẫn cung cấp điều mà người dùng thực sự muốn nhất, chính là văn bản đầu ra sạch sẽ, tự động mà không cần phải chỉnh sửa thủ công.

Tuy nhiên, AI Edge Eloquent của Google vẫn có một hạn chế ở thời điểm hiện tại. Các ứng dụng Wispr Flow, Willow và SuperWhisper hoạt động trên cả Mac, Windows và iOS, còn Eloquent hiện chỉ có trên iOS. Phiên bản Android đã được đề cập trong phần mô tả ứng dụng trên App Store nhưng vẫn chưa xuất hiện trên Play Store.
Đối với những người dùng phổ thông hoặc bất kỳ ai đang phải trả phí thuê bao hàng tháng chỉ vì trước đây chưa có lựa chọn miễn phí nào đáng tin cậy, ứng dụng này sẽ thay đổi hoàn toàn cuộc chơi. Nó có thể chưa cạnh tranh được Wispr Flow hay Willow đối với nhóm khách hàng doanh nghiệp cần hỗ trợ đa nền tảng, nhưng với đối tượng người dùng phổ thông ưu tiên sự nhanh gọn thì đây là một lựa chọn cực kỳ hấp dẫn.
Nguồn: Digital Trends






Comments