OpenAI vừa chính thức ra mắt ChatGPT Image 2.0 với hàng loạt nâng cấp về chất lượng ảnh, khả năng tạo chữ và độ chân thực. Đây được xem là bước cải tiến cần thiết, bởi phiên bản tạo ảnh trước đó của ChatGPT thường không được đánh giá cao và bị cho là thua kém rất nhiều so với mô hình Nano Banana của Google. Vậy với phiên bản Image 2.0 lần này, liệu ChatGPT đã có thể bắt kịp được Nano Banana 2 hay chưa?
Tốc độ phản hồi
Về tốc độ tạo ảnh, hai mô hình đã cho thấy sự chênh lệch khá rõ rệt khi thử nghiệm trên cùng tài khoản miễn phí với câu lệnh giống nhau. Cụ thể, ChatGPT Image 2.0 cần khoảng 2 phút đến 2 phút rưỡi để hoàn thiện một bức ảnh. Đây là khoảng thời gian khá lâu và gần như không có sự cải thiện đáng kể nào so với phiên bản tiền nhiệm. Điều này có thể gây ra bất tiện cho những người dùng cần tạo nhiều ảnh trong thời gian ngắn.

Trong khi đó, Nano Banana 2 vượt trội về tốc độ khi chỉ mất khoảng 30 đến 40 giây để tạo xong một bức ảnh, nhanh hơn gấp 3 đến 4 lần so với ChatGPT Image 2.0. Đây là lợi thế lớn của mô hình đến từ Google, đặc biệt khi người dùng cần tạo nhiều ảnh cùng lúc hoặc muốn chỉnh sửa ảnh mà không phải đợi quá lâu.
Chất lượng ảnh và độ phân giải
Thông số về độ phân giải, dung lượng ảnh của ChatGPT Image 2.0 và Nano Banana 2 khá tương đồng nhau. Tuy nhiên, nếu so sánh trên cùng phiên bản miễn phí, ChatGPT Image 2.0 phần lớn sẽ cho ra chất lượng ảnh tốt hơn so với Nano Banana 2. Các chi tiết trong ảnh được thể hiện sắc nét hơn, màu sắc cũng tự nhiên và hài hòa hơn. Đây là một điểm cộng lớn cho mô hình của OpenAI ở phân khúc người dùng miễn phí.

Tuy nhiên, ở phiên bản trả phí thông qua API. Nano Banana 2 đã hỗ trợ tạo ảnh với độ phân giải lên đến 4K, trong khi ChatGPT Image 2.0 hiện chỉ hỗ trợ tối đa 2K. Đối với những người dùng chuyên nghiệp cần ảnh chất lượng cao để phục vụ in ấn hoặc thiết kế, đây sẽ là yếu tố quan trọng cần cân nhắc khi lựa chọn mô hình phù hợp.

Khả năng tạo chữ Tiếng Việt
Khả năng xử lý và tạo chữ tiếng Việt luôn là một điểm yếu lớn của các mô hình AI tạo ảnh. Nguyên nhân là vì hệ thống dấu trong tiếng Việt phức tạp hơn nhiều so với các ngôn ngữ Latin thông thường. Với cùng một câu lệnh, cả hai mô hình đều xử lý đúng yêu cầu và bám sát nội dung đầu vào. Về khả năng tạo chữ tiếng Việt, kết quả của ChatGPT Image 2.0 và Nano Banana 2 khá tương đồng. Khi nhìn kỹ chỉ phát hiện khoảng 1 đến 2 lỗi nhỏ về dấu, nhưng vẫn hoàn toàn chấp nhận được.

Dù vậy, ChatGPT Image 2.0 vẫn được đánh giá cao hơn ở khía cạnh này nhờ phông chữ rõ ràng và dấu được hiển thị dễ đọc hơn. Còn với Nano Banana 2, phần dấu, đặc biệt là dấu hỏi và dấu ngã, thường bị khó nhìn và có xu hướng dính vào chữ, gây ảnh hưởng đến trải nghiệm đọc.

Nhờ sự nâng cấp này, ChatGPT Image 2.0 sẽ phù hợp hơn trong các trường hợp cần tạo ảnh infographic, poster hay banner quảng cáo. Đây là những nội dung đòi hỏi sự chi tiết ở từng chữ cái cũng như khả năng sáng tạo trong bố cục chữ. Đây là một bước tiến quan trọng giúp mô hình của OpenAI trở nên thực tế hơn trong các ứng dụng thiết kế.



Khả năng tạo ảnh chân thực
Khả năng tạo ảnh chân thực là tiêu chí mà ChatGPT Image 2.0 thể hiện sự vượt trội rõ rệt nhất so với Nano Banana 2. Với cùng một câu lệnh đầu vào, mô hình của OpenAI cho ra ảnh chân thực và ấn tượng hơn hẳn. Trong bài test tái hiện hình ảnh đường phố Hà Nội, ChatGPT Image 2.0 tạo ra bức ảnh rất tự nhiên, trông như được chụp trực tiếp từ máy ảnh. Các chi tiết về kiến trúc, ánh sáng cho đến bầu không khí đều hài hòa. Trong khi đó, Nano Banana 2 vẫn còn nhiều chi tiết chưa hợp lý, khiến người xem dễ dàng nhận ra đây là ảnh do AI tạo.

Có thể thấy rằng mô hình ChatGPT Image 2.0 đã được OpenAI huấn luyện dựa trên một lượng dữ liệu ảnh thực tế rất lớn và đa dạng, bởi nếu không có nguồn dữ liệu phong phú như vậy thì rất khó để AI có thể tái hiện lại những chi tiết đặc trưng của đường phố Hà Nội một cách chân thực đến thế.

Tương tự với bài test tạo ảnh chân dung, ChatGPT Image 2.0 tiếp tục ghi điểm nhờ cảm giác gần gũi, tự nhiên giống như chụp từ camera trước của điện thoại. Tông màu da, ánh sáng môi trường cho đến độ sâu trường ảnh đều được xử lý rất tinh tế.

Về phía Nano Banana 2, mô hình này vẫn đáp ứng tốt yêu cầu đề ra. Tuy nhiên, hiệu ứng xóa phông quá mức cùng phần nước da được làm bóng đã khiến bức ảnh trông quá “hoàn hảo”. Điều này làm cho ảnh thiếu đi sự tự nhiên và kém chân thực hơn so với ChatGPT Image 2.0.

Khả năng điều chỉnh tỷ lệ
Khả năng điều chỉnh tỷ lệ ảnh là một tính năng thiết thực, giúp người dùng tạo ra hình ảnh phù hợp với nhiều mục đích sử dụng khác nhau. Ở tiêu chí này, cả ChatGPT Image 2.0 và Nano Banana 2 đều cho thấy khả năng hỗ trợ tốt.

Cụ thể, cả hai mô hình đều có thể điều chỉnh hầu hết các tỷ lệ hình ảnh quen thuộc. Điểm đáng ghi nhận là các thành phần trong ảnh sẽ được tự động sắp xếp lại bố cục để phù hợp với tỷ lệ mới mà không làm mất hay sai lệch thông tin gốc. Đây là yếu tố quan trọng giúp đảm bảo tính nhất quán của nội dung ảnh khi thay đổi kích thước.

Người dùng có thể tận dụng tính năng điều chỉnh tỷ lệ của ChatGPT Image 2.0 và Nano Banana 2 để tạo ảnh phục vụ nhiều nhu cầu khác nhau, từ hình nền điện thoại, ảnh thumbnail cho video cho đến ảnh bìa Facebook hay các nền tảng mạng xã hội khác. Nhìn chung ở tiêu chí này, hai mô hình đều làm tốt như nhau.
Giới hạn tạo ảnh cho tài khoản miễn phí
Bên cạnh chất lượng ảnh, số lượng ảnh được phép tạo mỗi ngày trên tài khoản miễn phí cũng là yếu tố mà nhiều người dùng quan tâm. ChatGPT Image 2.0 hiện tại chỉ cho phép người dùng tạo tối đa 8 ảnh mỗi ngày trên tài khoản miễn phí. Khi đã hết lượt, người dùng sẽ phải đợi sang ngày hôm sau để tiếp tục sử dụng. Đây là một hạn chế đáng lưu ý, đặc biệt đối với những ai đang trong quá trình thử nghiệm và cần tạo nhiều ảnh để so sánh kết quả.
Trong khi đó, Nano Banana 2 thoải mái hơn đáng kể khi cho phép người dùng tạo đến tối đa 20 ảnh mỗi ngày. Với giới hạn này, người dùng miễn phí của Nano Banana 2 sẽ có nhiều không gian hơn để trải nghiệm và sáng tạo mà không phải lo lắng về việc hết lượt quá nhanh.
Tổng kết
Qua các tiêu chí so sánh, có thể thấy ChatGPT Image 2.0 đã cải tiến đáng kể so với phiên bản trước. Nổi bật nhất là chất lượng ảnh, khả năng tạo chữ Tiếng Việt và độ chân thực. Ở những tiêu chí này, mô hình của OpenAI đã chính thức vượt qua Nano Banana 2. Tuy nhiên, mô hình tạo ảnh của Google vẫn có lợi thế riêng nhờ tốc độ phản hồi nhanh hơn, hỗ trợ tạo ảnh 4K và cho phép tạo ảnh miễn phí nhiều hơn. Tùy vào nhu cầu sử dụng, mỗi mô hình sẽ phù hợp với từng nhóm người dùng khác nhau.




Comments