AIVật Vờ Đánh giá

Trải nghiệm Veo 3.1: Google nâng cấp AI tạo video, nhưng vẫn còn nhiều lỗi

0

Google vừa phát hành Veo 3.1, một bản cập nhật cho công cụ tạo video bằng AI có tên Veo. Phiên bản này tập trung vào việc giúp người dùng kiểm soát video tốt hơn, đồng thời cải thiện chất lượng hình ảnh và âm thanh. Veo 3.1 được xây dựng trên nền tảng của Veo 3, với mục tiêu nâng cao chất lượng video và bám sát câu lệnh của người dùng tốt hơn.

Cách truy cập và sử dụng Veo 3.1

Để sử dụng Veo 3.1 và các tính năng mới, người dùng có thể truy cập qua các nền tảng của Google. Người dùng thông thường có thể sử dụng miễn phí mô hình này trong Flow, công cụ làm phim AI của Google, và trong ứng dụng Gemini nhưng sẽ có giới hạn về số lượng tạo video cũng như số lượng credit khi tạo trong Flow. Đối với nhà phát triển và doanh nghiệp, Veo 3.1 và Veo 3.1 Fast đang được cung cấp thông qua Gemini API và Vertex AI. Các nhà phát triển có thể dùng các tính năng mới trong Veo Studio (yêu cầu có khóa Gemini API trả phí).

Các cải tiến chính của Veo 3.1

Veo 3.1 mang đến những nâng cấp chung nhằm cải thiện chất lượng hình ảnh, âm thanh và độ chân thực của video. Mô hình này có thể tạo ra âm thanh gốc đa dạng hơn, từ hội thoại đến các hiệu ứng được đồng bộ chính xác. Veo 3.1 cũng giúp người dùng kiểm soát câu chuyện tốt hơn nhờ khả năng hiểu các phong cách làm phim, từ đó tạo ra âm thanh, tiếng ồn môi trường và lời thoại phù hợp.

Một trong những khả năng quan trọng khác của Veo 3.1 được hãng công bố là mô phỏng “vật lý trong thế giới thực”. Điều này giúp mô hình tạo ra các video chân thực, tự nhiên và liền mạch, đặc biệt khi xử lý các yếu tố phức tạp như chuyển động, bóng đổ và ánh sáng. Tuy nhiên, khi so sánh với Sora 2, video do Veo 3.1 tạo ra không có quá nhiều điểm cải tiến khác biệt. Các hành động mạnh như nhào lộn hay các hiệu ứng nước vẫn có hiện tượng bị méo và sai lệch so với vật lý thực tế.

Prompt: “Một vận động viên thể dục dụng cụ uyển chuyển đang thực hiện một cú lộn người ấn tượng trên chiếc xà thăng bằng bóng bẩy, được ghi lại theo phong cách điện ảnh với các góc quay sinh động, ánh sáng kịch tính làm nổi bật vóc dáng thể thao của cô, và khán giả phía sau được làm mờ tạo chiều sâu.”
Prompt: “Một người đàn ông cơ bắp mặc quần bơi xanh sáng thực hiện cú nhảy “cannonball” ngoạn mục từ tấm ván nhảy trắng sáng bóng, tạo nên màn tung nước khổng lồ trong làn nước hồ bơi trong vắt. Ánh nắng phản chiếu lấp lánh trên mặt nước, còn những giọt nước bắn tung lên không trung như những viên kim cương lấp lánh.”
Prompt: “Một người đàn ông cơ bắp đang thực hiện cú nhào lộn ngược (backflip) trên một ván chèo màu xanh lam rực rỡ, làm tung tóe những giọt nước xung quanh, dưới bầu trời nắng chói chang, với những con sóng biển trong vắt ở phía sau — toàn bộ khoảnh khắc chuyển động được ghi lại với độ phân giải cao, đầy năng lượng và sống động.

Các tính năng chỉnh sửa mới

Trong bản cập nhật này, Veo 3.1 có thêm các công cụ chỉnh sửa và tính năng mới, cho phép người dùng kiểm soát chi tiết hơn đối với sản phẩm cuối cùng. Âm thanh cũng được tích hợp vào các tính năng chỉnh sửa này.

  1. Tạo video từ các thành phần: Tính năng này cho phép người dùng sử dụng tối đa 3 ảnh tham chiếu để kiểm soát các yếu tố như nhân vật, đối tượng hoặc phong cách. Điều này hữu ích để giữ sự nhất quán của nhân vật hoặc áp dụng một phong cách cụ thể cho cả video. Khi thử nghiệm, video tạo ra đã kết hợp đầy đủ các thành phần và khá đạt yêu cầu, tuy nhiên video được tạo bởi Flow đang bị lỗi mất âm thanh. Ngoài ra, phần khuôn mặt chỉ dừng ở mức tạm ổn, chưa thực sự giống với khuôn mặt trong ảnh gốc,.
Prompt: “Người trong ảnh mặc chiếc áo đỏ trong hình và bước vào giữa phòng, tạo dáng khoanh tay và nói: “anh em thấy áo này đẹp không, đẹp thì nhớ cổ vũ mờ u đấy””
Flow bị lỗi mất âm thanh
  1. Tạo video từ khung hình đầu và cuối: Với tính năng này, người dùng có thể cung cấp một ảnh bắt đầu và một ảnh kết thúc, mô hình sẽ tự tạo ra một video chuyển động mượt mà để nối hai ảnh đó lại. Mình đã thử với 2 ví dụ và nhận thấy khả năng chuyển cảnh của Veo 3.1 rất ấn tượng. Hai bức ảnh đầu và cuối được nối lại liền mạch, tạo cảm giác như một video được quay ‘one shot’.
Prompt: “Chuyển cảnh 2 ảnh sao cho mượt mà và liền mạch từ trái qua phải”
Prompt: “Chuyển cảnh 2 ảnh sao cho mượt mà và liền mạch từ trái qua phải”
  1. Chèn thêm yếu tố mới vào video: Với tính năng này, người dùng có thể thêm bất kỳ đối tượng nào vào một cảnh quay có sẵn. AI sẽ tự xử lý các chi tiết như đổ bóng, ánh sáng để vật thể được thêm vào trông tự nhiên hơn. Với các yêu cầu như thêm phương tiện giao thông và thêm mưa vào khung cảnh, video tạo ra khá đạt yêu cầu và trông khá chân thực, dù vẫn còn một vài lỗi nhỏ nhưng có thể chấp nhận được. Lưu ý rằng tính năng này hiện vẫn chưa được hỗ trợ trong Gemini API.
Prompt: “thêm nhiều xe máy và ô tô di chuyển trên đường”
Prompt: “thêm trời mưa rào”
  1. Xóa đối tượng/vật thể không mong muốn: Đây là tính năng sắp ra mắt, cho phép người dùng xóa những đối tượng không mong muốn khỏi cảnh quay. AI sẽ tự tái tạo lại nền và môi trường xung quanh. Khi thử nghiệm với những câu lệnh như xóa người di chuyển trên đường hay xóa chữ trên hình, Veo 3.1 mới chỉ từ từ đưa đối tượng được chỉ định ra khỏi khung hình chứ không xóa hoàn toàn ngay từ đầu. Ngoài ra, khuôn mặt người trong hình cũng bị biến dạng và thay đổi liên tục, chưa thực sự giữ được tính nhất quán như hãng đã công bố.
Prompt: “xóa người đi bộ trên đường”
Prompt: “bỏ chữ cái có trong hình và cho người mặc áo trắng giơ chiếc điện thoại và nói bằng tiếng Việt: ‘Trên tay mình đây là chiếc iPhone 17 Pro Max phiên bản màu cam vũ trụ, vô cùng là nổi bật luôn’”

Veo 3.1 là một bản cập nhật tập trung vào việc trao cho người dùng nhiều quyền kiểm soát hơn thông qua một loạt tính năng chỉnh sửa mới. Tuy nhiên, qua thực tế sử dụng, có thể thấy mô hình này vẫn đang trong giai đoạn phát triển. Trong khi một số tính năng hoạt động khá tốt, nhiều tính năng quan trọng khác lại chưa ổn định, gặp lỗi hoặc cho ra kết quả chưa như mong đợi. Do đó người dùng cần chờ đợi các bản cập nhật trong tương lai để Veo 3.1 có thể hoàn thiện hơn và cạnh tranh được với Sora 2 của OpenAI.

Samsung sẽ ngừng tích hợp dịch vụ sao lưu ảnh trên OneDrive từ 2026: Người dùng cần phải làm gì?

Previous article

Sự cố pin dự phòng phát nổ, chuyến bay CA139 đi Hàn Quốc phải quay đầu

Next article

Comments