AITin tức

Tạm biệt chuột và bàn phím? Đối thủ của ChatGPT phát triển điều khiển PC bằng giọng nói

0

Công ty khởi nghiệp về trí tuệ nhân tạo Anthropic đang nổi lên như một tên tuổi đáng chú ý bên cạnh các “ông lớn” công nghệ ở Thung lũng Silicon, chủ yếu nhờ hai yếu tố.

  • Thứ nhất, công ty được thành lập bởi các cựu kỹ sư của OpenAI, những người đã rời đi do bất đồng quan điểm với CEO Sam Altman.
  • Thứ hai, Anthropic khẳng định cách tiếp cận AI chatbot — và các mô hình ngôn ngữ lớn mang tên Claude — của họ mang tính trách nhiệm cao hơn, tập trung vào việc loại bỏ các phản hồi độc hại hoặc phi đạo đức.

Mike Krieger, Giám đốc Sản phẩm của Anthropic, đồng thời là nhà đồng sáng lập Instagram, đã chia sẻ với Financial Times về kế hoạch của công ty nhằm nâng cao hiệu quả “công việc trí tuệ”, giúp người dùng tiết kiệm thời gian đáng kể khi làm việc với các ứng dụng như “Excel hay Google Docs”.

Một trong những giải pháp tiềm năng là thông qua các hệ thống tác nhân, nơi AI của Anthropic có khả năng điều khiển toàn bộ máy tính để bàn của người dùng bằng các câu lệnh ngôn ngữ tự nhiên. Về cơ bản, ý tưởng này tương đồng với chế độ Operator của ChatGPT, cho phép AI duyệt web theo yêu cầu của bạn.

Điều khiển PC bằng giọng nói: Giao diện người dùng tự nhiên

Mike Krieger hình dung rằng một phương thức triển khai Claude để điều khiển máy tính để bàn sẽ là thông qua giọng nói, bởi đây là “giao diện người dùng tự nhiên hơn”. Năm ngoái, Anthropic đã trình diễn một tác nhân AI có khả năng điều khiển máy tính bằng các lệnh văn bản.

Trong tương lai, tính năng điều khiển bằng giọng nói được kỳ vọng sẽ là một phần mở rộng của chức năng hiện tại. Mặc dù chưa có khung thời gian cụ thể (hoặc xác nhận chính thức) về việc tính năng điều khiển PC bằng giọng nói có trở thành hiện thực hay không, Anthropic đã bắt đầu phát triển chế độ giọng nói.

Vị lãnh đạo này cho biết công ty đang trong giai đoạn thử nghiệm nguyên mẫu tính năng điều khiển bằng giọng nói cho Claude. Thay vì nhắm đến thị trường tiêu dùng đại trà ngay lập tức, Anthropic đang tập trung vào các mối quan hệ đối tác doanh nghiệp để tạo lợi thế cạnh tranh so với các đối thủ như OpenAI, Meta và Google.

“Tôi hy vọng Claude sẽ tiếp cận được càng nhiều người càng tốt, nhưng ưu tiên hàng đầu hiện tại không phải là việc phổ biến rộng rãi cho người dùng cá nhân,” Giám đốc Sản phẩm của Anthropic nhấn mạnh.

Tuy nhiên, nếu chức năng giọng nói được tích hợp cho người dùng Claude, một nền tảng lý tưởng để triển khai sẽ là ứng dụng di động ra mắt vào tháng 8 năm ngoái. Thực tế, chế độ giọng nói của Claude đã phần nào hiện diện thông qua phiên bản Alexa+ được Amazon nâng cấp, vốn sử dụng các mô hình ngôn ngữ lớn của Claude.

Đây có lẽ là kết quả trực tiếp từ khoản đầu tư 4 tỷ đô la Mỹ của Amazon vào Anthropic. Công ty này cũng có thể đang tìm kiếm các đối tác khác để ra mắt các sản phẩm dựa trên giọng nói, nhưng ngoài Amazon, chưa có bất kỳ liên minh nào khác được tiết lộ.

Trong khi đó, các đối thủ trực tiếp như OpenAI và Google đã sở hữu các tính năng giọng nói mạnh mẽ thông qua chế độ giọng nói tương ứng trong ChatGPT và Gemini.

Theo Digital Trends

Windows 11 tiến gần hơn đến việc điều khiển PC bằng ngôn ngữ tự nhiên

Previous article

Điều khiển trò chơi bằng ý nghĩ: Băng đô Muse S Athena mang khoa học viễn tưởng thành hiện thực

Next article

Comments

Comments are closed.