Sau lần hé lộ tại sự kiện ra mắt Pixel 10 series, Google vừa chính thức tung ra một bản cập nhật quan trọng cho Gemini Live trên cả hai nền tảng iOS và Android. Cải tiến cốt lõi lần này nằm ở mô hình âm thanh gốc (native audio), giúp Gemini Live có khả năng hiểu và sử dụng các yếu tố trong lời nói của con người một cách tinh tế hơn, từ đó tạo ra những cuộc hội thoại “linh hoạt và biểu cảm”.
Gemini Live cập nhật mô hình mới

Điểm nổi bật nhất của bản cập nhật này là khả năng cho phép người dùng tùy chỉnh giọng nói của AI ngay trong lúc trò chuyện. Bạn có thể yêu cầu Gemini Live nói nhanh hơn, chậm lại, thay đổi tông giọng hoặc thậm chí sử dụng một ngữ điệu (accent) khác cho phù hợp với nhu cầu.
Theo Google, đằng sau sự thay đổi này là một mô hình AI mới, được cho là Gemini 2.5 Flash Live API với công nghệ âm thanh gốc. Mô hình này được mô tả là mang lại “chất lượng âm thanh cải thiện vượt bậc, cho cảm giác như đang nói chuyện với một người thật”, đúng như những gì người dùng đang trải nghiệm.
Ứng dụng thực tế đa dạng
Google đã đưa ra nhiều ví dụ cụ thể về cách người dùng có thể tận dụng tính năng mới này:
- Học tập: Một sinh viên có thể yêu cầu Gemini Live “nói nhanh hơn” để kịp nghe câu trả lời trước khi vào lớp.
- Luyện tập kỹ năng: Người dùng có thể dùng Gemini Live để luyện nói một ngôn ngữ mới, chuẩn bị cho buổi phỏng vấn xin việc, hoặc trau dồi kỹ năng thuyết trình trước đám đông.
- Giải trí: Gemini Live có thể kể chuyện với các giọng điệu khác nhau cho từng nhân vật, hoặc sử dụng một ngữ điệu vui nhộn tùy theo tình huống.
Một lưu ý quan trọng là các tùy chỉnh về giọng nói sẽ chỉ kéo dài trong phiên trò chuyện hiện tại. Khi bạn bắt đầu một cuộc hội thoại mới, Gemini Live sẽ trở về cài đặt mặc định, cho phép bạn tự do sáng tạo cho lần tương tác tiếp theo.
Bản cập nhật này hiện đã có sẵn cho tất cả người dùng thông qua ứng dụng Gemini trên App Store và Google Play.
Theo: Android Authority






Comments