AITin tức

Dùng Nano Banana Pro để tô màu, “vietsub” truyện tranh: AI giờ đỉnh như thế này đây!

    0

    Sau khi ra mắt, mô hình Nano Banana Pro của Google đã tạo nên tiếng vang lớn nhờ khả năng xử lý văn bản trong ảnh vượt trội. Song, liệu điều này có được duy trì khi áp dụng vào các tác vụ đòi hỏi tính nghệ thuật và độ chính xác cao hơn như truyện tranh?

    Trong bài viết dưới đây, mình sẽ thử thách Nano Banana Pro trên nền tảng Gemini 3 Pro với hàng loạt bài kiểm tra liên quan đến truyện tranh. Từ việc tô màu, dịch thuật (vietsub) cho đến xử lý các poster đen trắng phức tạp, hãy cùng xem AI thể hiện ra sao trong bài viết dưới đây.

    Tô màu, dịch truyện tranh

    Thử thách đầu tiên mình đặt ra cho Nano Banana Pro là dịch một mẩu truyện ngắn từ tiếng Anh sang tiếng Việt. Đối tượng được chọn là một đoạn trong bộ truyện tranh Doraemon. Mình đã ghép hai cảnh lại với nhau và đưa ra yêu cầu cụ thể cho AI. Không chỉ đơn thuần là chuyển ngữ, mình yêu cầu Gemini phải giữ nguyên định dạng font chữ truyện tranh đặc trưng (kiểu Comic Sans) để đảm bảo tính thẩm mỹ vốn có của trang truyện.

    Yêu cầu 1: Hãy dịch mẩu truyện sau sang ngôn ngữ tiếng Việt, phần dịch được thay thế vào văn bản gốc, giữ đúng font chữ và cách định dạng của mẩu truyện.

    Kết quả trả về khiến mình khá ấn tượng. Nano Banana Pro trên Gemini 3 Pro đã nhận diện và dịch thuật các câu thoại rất sát với nghĩa gốc. Điều đáng khen ngợi nhất là AI đã tuân thủ yêu cầu về hình thức. Phông chữ trong các ô thoại được tái tạo chuẩn xác, trông rất giống với font chữ mà các nhà xuất bản truyện tranh thường sử dụng.

    Các ký tự tiếng Việt có dấu, vốn là điểm yếu của các mô hình tạo ảnh trước đây, nay đã được xử lý mượt mà. Vị trí đặt chữ cũng rất gọn gàng, nằm chính giữa các ô thoại mà không bị tràn lề hay đè lên các chi tiết khác của nhân vật.

    Tuy nhiên, nếu xét về độ tự nhiên, bản dịch của AI vẫn còn hạn chế. Nó đảm bảo đúng nghĩa nhưng thiếu đi sự dí dỏm, hồn nhiên đặc trưng mà các dịch giả thường sử dụng. Câu văn đôi khi còn hơi cứng nhắc, mang phong cách “dịch máy” hơn là văn phong truyện tranh.

    Dù vậy, với một công cụ tự động, khả năng xử lý ngôn ngữ này đã là rất đáng nể, đặc biệt là khả năng giữ nguyên cấu trúc hình ảnh gốc sau khi thay thế văn bản. Người dùng phổ thông hoàn toàn có thể dùng nó để hiểu nhanh nội dung các bộ truyện nước ngoài mà chưa có bản dịch chính thức.

    Kết quả

    Truyện gốc
    Truyện gốc
    Truyện đã xử lý
    Truyện đã xử lý

    Tiếp tục trên chính khung cảnh Doraemon đó, mình chuyển sang thử thách thứ hai: Tô màu. Từ một trang truyện đen trắng ban đầu, mình yêu cầu AI phối màu sao cho phù hợp với bối cảnh và đặc điểm nhận dạng của các nhân vật.

    Yêu cầu 2: Tiếp theo, hãy tô màu mẩu truyện này, sao cho màu sắc của các nhân vật hay bối cảnh sát so với bộ truyện Doraemon nhất.

    Kết quả cho thấy Nano Banana Pro xử lý rất tốt. Với bối cảnh Suneo đang cáu gắt hay màn tranh luận giữa Nobita và Suneo, AI đã chủ động thay đổi màu nền sang các tông màu nóng hoặc trầm hơn để thể hiện sự căng thẳng. Điều này cho thấy nó không chỉ tô màu ngẫu nhiên mà thực sự phân tích nội dung bức ảnh.

    Các chi tiết đặc trưng của nhân vật cũng được tái hiện chính. Màu xanh dương của Doraemon, chiếc mũi đỏ, hay chiếc vòng cổ đều chuẩn chỉ, ít có sự sai lệch so với nguyên tác anime.

    Thế nhưng, khi soi kỹ hơn vào từng chi tiết, mình bắt đầu nhận ra điểm yếu của Nano Banana Pro trong việc duy trì tính nhất quán. Cùng là nhân vật Nobita, nhưng ở khung tranh bên trái, chiếc áo cậu đang mặc được tô màu xanh lá, trong khi ngay ở khung tranh bên phải, chiếc áo đó lại biến thành màu vàng.

    Kết quả

    Truyện mẫu
    Truyện mẫu
    Truyện đã xử lý
    Truyện đã xử lý

    Để khắc phục và mong muốn đạt kết quả tốt hơn, mình đã thử nghiệm với một câu lệnh (prompt) chi tiết và khắt khe hơn ở lần thử thứ ba. Mình yêu cầu Gemini đóng vai một “chuyên gia tô màu” và một “biên dịch viên chuyên nghiệp”. Thử thách lần này khó hơn: Dịch cả các hiệu ứng âm thanh (SFX) tiếng Nhật sang tiếng Việt.

    Mình đã mô tả khá kỹ trong prompt, yêu cầu các từ tượng thanh như tiếng va đập, tiếng nổ phải được Việt hóa và sử dụng font chữ đồ họa tương ứng.

    Yêu cầu 3: Đóng vai một chuyên gia tô màu truyện tranh và một biên dịch viên truyện tranh Nhật-Việt chuyên nghiệp, hãy: 
    - Tô màu cho trang truyện tranh đen trắng được cung cấp bên dưới.
    - Nhận dạng và dịch toàn bộ văn bản tiếng Anh trong ảnh sang tiếng Việt. Sử dụng văn phong tự nhiên, phù hợp với ngữ cảnh truyện tranh. Hãy thay thế văn bản gốc bằng văn bản tiếng Việt.
    - Với các từ tượng thanh/Hiệu ứng bằng tiếng Anh - tiếng Nhật, hãy vẽ đè sound effect (SFX) tiếng Việt lên vị trí cũ. Ví dụ: Chữ "Don!" thay bằng "Đùng!". Yêu cầu font chữ phải mô phỏng nét cọ vẽ tay hung dữ.

    Kết quả lần này đạt khoảng 80% kỳ vọng của mình. Về mặt hình ảnh và màu sắc, Nano Banana Pro vẫn làm rất tốt, các vật thể trong khung hình đều được tách lớp và đổ màu rõ ràng.

    Tuy nhiên, rào cản ngôn ngữ ở các hiệu ứng âm thanh vẫn là một bài toán khó. Các từ tiếng Nhật mô tả âm thanh như “Bốp”, “Bụp” dù đã được mình yêu cầu dịch, nhưng AI vẫn bỏ sót khá nhiều. Một số chỗ nó vẫn giữ nguyên ký tự tiếng Nhật, hoặc chỉ thay đổi màu sắc chứ không thay đổi nội dung chữ.

    Có vẻ như việc can thiệp vào các nét vẽ đồ họa phức tạp (như chữ tượng thanh lồng vào hình vẽ) khó khăn hơn nhiều so với việc thay thế văn bản trong các ô thoại. Nano Banana Pro vẫn chưa thực sự phân biệt rạch ròi được đâu là nét vẽ tranh và đâu là ký tự cần dịch trong những trường hợp này.

    Kết quả

    Truyện mẫu
    Truyện mẫu
    Truyện đã xử lý
    Truyện đã xử lý

    Trong trường hợp tiếp theo, mình tiếp tục nâng độ khó với một trang truyện có bối cảnh không gian vũ trụ. Đây là cảnh con tàu của nhóm Doraemon đang giao tranh quyết liệt với kẻ địch. Trang truyện này chứa dày đặc các chi tiết máy móc, tia sáng, khói bụi và các đường nét chuyển động.

    Yêu cầu 4: Đóng vai một chuyên gia tô màu truyện tranh và một biên dịch viên truyện tranh Nhật-Việt chuyên nghiệp, hãy: 
    - Tô màu cho trang truyện tranh đen trắng được cung cấp bên dưới.
    - Nhận dạng và dịch toàn bộ văn bản tiếng Anh trong ảnh sang tiếng Việt. Sử dụng văn phong tự nhiên, phù hợp với ngữ cảnh truyện tranh. Hãy thay thế văn bản gốc bằng văn bản tiếng Việt.
    - Với các từ tượng thanh/Hiệu ứng, hãy vẽ đè sound effect (SFX) tiếng Việt lên vị trí cũ. Ví dụ: Chữ "Don!" thay bằng "Đùng!". Yêu cầu font chữ phải mô phỏng nét cọ vẽ tay hung dữ.

    Nano Banana Pro trên Gemini 3 Pro đã xử lý bối cảnh phức tạp này khá tốt. Màu đen sâu thẳm của vũ trụ, ánh sáng chói lòa từ các vụ nổ hay các vệt sáng của tia laser đều được tái tạo rất “điện ảnh”. Sự tương phản giữa các vùng sáng tối được đẩy lên cao.

    Dù chi tiết rất nhiều và dễ gây rối mắt, nhưng AI không bị “lú” lẫn các mảng màu. Các chi tiết nhỏ trên thân tàu vũ trụ vẫn giữ được độ sắc nét. Tuy nhiên, một lần nữa, các hiệu ứng âm thanh như tiếng nổ “Đùng”, “Đoàng” vẫn chưa được dịch thuật trọn vẹn sang tiếng Việt như ý muốn.

    Kết quả

    Truyện mẫu
    Truyện mẫu
    Truyện đã xử lý
    Truyện đã xử lý

    Cuối cùng, mình thử nghiệm Nano Banana Pro trong việc xử lý nhiều trang truyện cùng lúc. Mình đã chọn 4 trang liên tiếp của bộ truyện “Thần Đồng Đất Việt” – một tác phẩm truyện tranh thuần Việt với nét vẽ và bối cảnh rất đặc trưng. Mình yêu cầu AI tô màu cùng lúc cả 4 trang này.

    Yêu cầu 5: Đóng vai một chuyên gia tô màu truyện tranh, hãy tô màu cho trang truyện tranh đen trắng được cung cấp bên dưới.

    Dù phải xử lý 4 trang cùng lúc, chất lượng đầu ra của Nano Banana Pro nhìn chung vẫn tốt. Phần đổ bóng cho các nhân vật như Tí, Sửu cũng được thực hiện khá tinh tế, tạo cảm giác nổi khối (3D) rõ rệt. Với khả năng này, người dùng hoàn toàn có thể tự mình “remaster” lại những bộ truyện tranh tuổi thơ, mang lại trải nghiệm đọc mới mẻ và thú vị hơn rất nhiều.

    Điểm quan trọng nhất là phần lời thoại tiếng Việt gốc trong các ô thoại được AI giữ nguyên vẹn 100%. Không có tình trạng chữ bị nhòe, bị biến dạng hay bị tô màu đè lên làm mất nội dung. Đây là yếu tố quan trọng đối với trải nghiệm đọc truyện.

    Kết quả

    Truyện mẫu
    Truyện mẫu
    Truyện đã xử lý
    Truyện đã xử lý

    Tô màu poster đen trắng

    TIếp theo, mình chuyển sang một thử thách khác: Tô màu poster. Poster được sử dụng là trang bìa đen trắng của bộ manga nổi tiếng Inuyasha. Bức ảnh gốc chỉ có các nét mực đen, và nhiệm vụ của AI là phải biến nó thành một tác phẩm bìa màu hoàn chỉnh.

    Yêu cầu 6: Đóng vai một họa sĩ, hãy tô màu cho tấm Poster này. 

    Có thể thấy, Nano Banana Pro nhận diện chính xác nhân vật Inuyasha với bộ trang phục màu đỏ rực đặc trưng. Mái tóc trắng bạch kim cũng được xử lý đúng chuẩn, tách biệt hoàn toàn với phần nền phía sau. Không chỉ nhân vật chính, các nhân vật phụ lấp ló phía sau cũng được tô điểm màu sắc rất hài hòa.

    Nếu chỉ nhìn lướt qua thành phẩm này mà không soi xét quá kỹ các chi tiết nhỏ, mình tin rằng đa số người xem sẽ nghĩ đây là một tấm poster do họa sĩ vẽ màu thực hiện. Sự khác biệt giữa sản phẩm của AI và người thật trong tác vụ này đã bị xóa nhòa đáng kể.

    Kết quả

    Truyện mẫu
    Truyện mẫu
    Truyện đã xử lý
    Truyện đã xử lý

    Tạm kết: Nano Banana Pro trong Gemini 3 Pro

    Có thể thấy, dù vẫn còn những hạn chế nhất định về tính nhất quán hay khả năng dịch thuật hiệu ứng âm thanh, nhưng Nano Banana Pro trên Gemini 3 Pro đã chứng minh mình là một công cụ đắc lực cho nhu cầu giải trí và sáng tạo. Người dùng có thể tận dụng mô hình này trong việc tô màu các bộ truyện đen trắng, hay “vietsub” các bộ truyện tranh yêu thích mà không được phát hành tại Việt Nam.

    Cũng cần nhấn mạnh rằng tất cả các bài thử nghiệm mình thực hiện trong bài viết này đều chỉ mang tính chất tham khảo. Mục đích chính là để kiểm chứng năng lực xử lý của mô hình AI mới. Người dùng chỉ nên xem đây là một công cụ hỗ trợ, không nên lạm dụng để thay thế hoàn toàn việc tư duy. Việc phụ thuộc quá mức vào AI sẽ dẫn đến những hậu quả tiêu cực trong tương lai.

    Comments