Tại sự kiện Google I/O 2026, Google chính thức trình làng Gemini Omni, thế hệ trí tuệ nhân tạo mới nhất có khả năng tạo và chỉnh sửa video từ nhiều loại dữ liệu đầu vào. Phiên bản đầu tiên mang tên Gemini Omni Flash đã lập tức được phát hành cho nhóm người dùng trả phí và chuẩn bị tích hợp lên nền tảng YouTube ngay trong tuần này.
Khả năng tạo và chỉnh sửa video bằng đa dữ liệu đầu vào
Hệ thống trí tuệ nhân tạo mới của Google sở hữu năng lực xử lý đồng thời văn bản, hình ảnh, âm thanh và video. Người dùng chỉ cần cung cấp một bức ảnh nhân vật, ghép cùng một đoạn nhạc và nhập câu lệnh bằng văn bản là có thể nhận về một đoạn phim hoàn chỉnh theo đúng nhịp điệu mong muốn.
Điểm nổi bật nhất của công nghệ này là khả năng biên tập video thông qua ngôn ngữ tự nhiên. Quá trình tinh chỉnh diễn ra liên tục theo dạng hội thoại. Các câu lệnh đi sau sẽ tự động kế thừa bối cảnh của câu lệnh trước, giúp giữ nguyên hình dáng nhân vật và các chi tiết nền. Bạn hoàn toàn có thể ra lệnh biến một bức tượng trong video thành bong bóng, hay làm cho mặt gương gợn sóng khi có bàn tay chạm vào. Máy học của Google tự động tính toán các lực tác động vật lý như trọng lực, động năng hay sự di chuyển của chất lỏng để đảm bảo chuyển động trong khung hình diễn ra chân thực nhất.
Không dừng lại ở việc tạo ra những hình ảnh bắt mắt, mô hình AI này còn được nạp sẵn một kho kiến thức khổng lồ về lịch sử, khoa học và văn hóa. Thử nghiệm thực tế từ Google cho thấy công cụ có khả năng dựng một video hoạt hình đất sét giải thích chi tiết cơ chế gập của protein dựa trên dữ liệu y khoa chính xác.
Những định dạng phức tạp này thường tiêu tốn rất nhiều thời gian đồ họa thủ công, nhưng nay được xử lý nhanh chóng chỉ bằng một vài dòng lệnh. Các nhà sáng tạo nội dung giáo dục sẽ được hưởng lợi lớn khi có thể minh họa những khái niệm trừu tượng thành hình ảnh trực quan một cách dễ dàng.
Nhằm đối phó với rủi ro lạm dụng công nghệ để giả mạo danh tính, Google đã thiết lập các rào cản bảo mật nghiêm ngặt ngay từ ngày đầu ra mắt. Hệ thống cung cấp tính năng Avatar kỹ thuật số, cho phép người dùng tự tạo ra phiên bản ảo mang diện mạo và giọng nói của chính mình để sản xuất video. Việc dùng AI để thay đổi giọng nói của người khác tạm thời bị khóa cho đến khi các bài kiểm tra an toàn hoàn tất. Toàn bộ video xuất ra từ hệ thống đều được tự động gắn mã thủy vân SynthID ẩn. Mã này giúp người xem kiểm tra nhanh nguồn gốc video thông qua công cụ tìm kiếm của Google hoặc trình duyệt Chrome.
Tùy thuộc vào loại tài khoản, người dùng có những cách khác nhau để tiếp cận công cụ mới. Những ai đang đăng ký gói dịch vụ Google AI Plus, Pro và Ultra đã có thể dùng thử Gemini Omni Flash trên ứng dụng Gemini và Google Flow. Nhóm người dùng YouTube Shorts và YouTube Create sẽ nhận bản cập nhật hoàn toàn miễn phí từ tuần này. Khách hàng doanh nghiệp và các nhà phát triển phần mềm cần đợi vài tuần nữa để kết nối hệ thống thông qua giao diện API.


