ChatGPT đang ngày càng trở nên phổ biến và được ưa chuộng nhờ những cải tiến không ngừng từ OpenAI. Mặc dù Advanced Voice Mode (Chế độ Giọng nói Nâng cao) với khả năng tương tác bằng giọng nói tự nhiên đã được ra mắt, người dùng vẫn đang mong chờ sự xuất hiện của tính năng xử lý hình ảnh trực tiếp (Live Video) từng được giới thiệu trước đó. Tin vui là tính năng này có thể sớm được triển khai cho người dùng phổ thông.
Tại sự kiện ra mắt GPT-4o vào tháng 5/2024, OpenAI đã trình diễn bản demo ấn tượng về khả năng thị giác trực tiếp của Chế độ Giọng nói Nâng cao. Trong đó, ChatGPT có thể nhận diện chính xác chủ thể trong video, ghi nhớ tên, nhận biết đồ vật và liên kết chúng với các hoạt động tương ứng. Bản demo này cho thấy khả năng tương tác thời gian thực mạnh mẽ và tự nhiên của ChatGPT, gần giống như đang giao tiếp với người thật.
Mặc dù một số người dùng đã được trải nghiệm tính năng Video Trực tiếp trong giai đoạn thử nghiệm alpha và đánh giá rất cao, OpenAI vẫn chưa công bố thời gian phát hành chính thức.
Tuy nhiên, những dấu hiệu tích cực đã xuất hiện. Chuyên trang Android Authority đã phát hiện ra những đoạn mã liên quan đến tính năng “Camera trực tiếp” (tên dự kiến của Live Video) trong bản cập nhật beta ChatGPT v1.2024.317. Cùng với đó là những cảnh báo người dùng không sử dụng tính năng này cho các hoạt động điều hướng trực tiếp hoặc những quyết định ảnh hưởng đến sức khỏe, sự an toàn. Điều này cho thấy OpenAI đang chuẩn bị cho việc triển khai bản beta rộng rãi hơn trong tương lai gần.
Dự đoán, tính năng Video Trực tiếp có thể sẽ được ưu tiên cho người dùng ChatGPT Plus và các gói trả phí khác.
Theo Android Authority
Comments