AITin tức

Elevenlabs ra mắt Conversational AI 2.0 với hàng loạt tính năng mới

0

ElevenLabs vừa chính thức ra mắt Conversational AI 2.0, một bước tiến nhằm tạo ra giọng nói AI tinh vi và chân thực hơn. Chỉ 5 tháng sau phiên bản đầu, bản cập nhật này mang đến nhiều cải tiến đáng kể và sẵn sàng đáp ứng toàn diện nhu cầu doanh nghiệp. Hoàn thiện phiên bản 2.0 chỉ trong 4 tháng, ElevenLabs cho thấy cam kết mạnh mẽ trong việc không ngừng đổi mới và mang lại giá trị vượt trội.

Tính năng mới của Elevenlabs có gì đặc biệt?

Conversational AI 2.0 cho phép xây dựng các tác nhân giọng nói AI (voice agents) có khả năng trò chuyện một cách tự nhiên và gần gũi như con người. So với phiên bản 1.0 chỉ có API trò chuyện cơ bản và hỗ trợ giọng nói đơn thuần, phiên bản 2.0 mang đến những nâng cấp vượt trội về luồng tương tác, khả năng đa ngôn ngữ và tích hợp doanh nghiệp. Nền tảng này phù hợp với nhiều ứng dụng thực tế, từ dịch vụ khách hàng, hỗ trợ y tế, đến sáng tạo nội dung.

Conversational AI 2.0 giới thiệu các tính năng tiên tiến, vượt xa phiên bản tiền nhiệm:

Mô hình luân phiên giao tiếp thông minh hơn: Khác với phiên bản 1.0, phiên bản 2.0 tích hợp mô hình phân tích tín hiệu giao tiếp như “ừm” hay “à” theo thời gian thực. Điều này giúp AI hiểu khi nào nên ngắt lời hoặc chờ đợi một cách hợp lý, tạo ra các cuộc đối thoại mượt mà hơn. Tính năng này đặc biệt lý tưởng cho các tình huống dịch vụ khách hàng, khi người dùng cần thời gian để tìm kiếm thông tin (ví dụ: “Ồ, để tôi kiểm tra lại. Ừm…”).

Chuyển đổi ngôn ngữ tự động: Thay vì phải chuyển đổi thủ công như ở phiên bản 1.0, phiên bản 2.0 tích hợp khả năng phát hiện ngôn ngữ trực tiếp. Nhờ đó, AI có thể tự động nhận diện và phản hồi bằng ngôn ngữ phù hợp, hỗ trợ giao tiếp đa ngôn ngữ một cách liền mạch. Đây là một lợi thế lớn cho các doanh nghiệp hoạt động trên phạm vi toàn cầu.

Chế độ đa mhân vật linh hoạt: Nâng cấp từ việc chỉ sử dụng một giọng nói cố định ở phiên bản 1.0, giờ đây một tác nhân AI có thể linh hoạt chuyển đổi giữa nhiều giọng điệu và nhân vật khác nhau. Điều này làm tăng tính linh hoạt và độ chân thực cho cuộc trò chuyện.

Tích hợp RAG (Retrieval augmented generation): Tính năng này không có ở phiên bản 1.0. RAG trong phiên bản 2.0 cho phép AI truy xuất thông tin từ cơ sở tri thức với độ trễ tối thiểu và đảm bảo bảo mật tối đa. Ví dụ, một trợ lý y tế ảo có thể nhanh chóng lấy hướng dẫn điều trị, hoặc nhân viên hỗ trợ có thể truy cập tài liệu nội bộ một cách tức thì.

Nền tảng vững chắc cho doanh nghiệp

Conversational AI 2.0 được xây dựng với nền tảng vững chắc nhằm đáp ứng những yêu cầu khắt khe nhất của doanh nghiệp hiện đại:

  • Tuân Thủ HIPAA: Đảm bảo tính bảo mật cho dữ liệu y tế, hỗ trợ các ứng dụng quan trọng như trợ lý RAG trong lĩnh vực chăm sóc sức khỏe.
  • Lưu Trữ Dữ Liệu Tại EU: Đáp ứng các yêu cầu nghiêm ngặt về bảo mật dữ liệu cho các tổ chức hoạt động hoặc phục vụ khách hàng tại Liên minh Châu Âu.
  • Bảo Mật và Độ Tin Cậy Cao: Vượt xa các tiêu chuẩn bảo mật của phiên bản 1.0, phiên bản 2.0 cung cấp giải pháp bảo mật cấp doanh nghiệp, khả năng tích hợp với các bên thứ ba và độ tin cậy hàng đầu (lên đến 99,9%), đảm bảo hoạt động ổn định cho các chức năng quan trọng.

Tuy nhiên, Conversational AI 2.0 của ElevenLabs không đơn độc trên thị trường giọng nói AI. Các đối thủ đáng chú ý bao gồm NotebookLM của Google, một trợ lý nghiên cứu AI cho phép tương tác bằng giọng nói với tài liệu, và ChatGPT của OpenAI, với khả năng đàm thoại AI mạnh mẽ. Sự cạnh tranh này đang thúc đẩy sự đổi mới không ngừng, hứa hẹn mang đến những công cụ ngày càng tinh vi và linh hoạt hơn cho người dùng.

Trải nghiệm Blip: Thêm một công cụ truyền file giữa MacBook và điện thoại Android cực hay

Previous article

Gemini Live chính thức có mặt miễn phí cho người dùng iOS

Next article

Comments

Comments are closed.