Google vừa chính thức phát hành Imagen 3, phiên bản mới nhất của công cụ tạo ảnh AI bằng cách nhập văn bản, đến người dùng tại Mỹ. Theo VentureBeat, người dùng có thể truy cập công cụ này trên nền tảng AI Test Kitchen của Google. So với các mô hình trước đây, Imagen 3 được cho là tạo ra hình ảnh với “độ chi tiết tốt hơn, ánh sáng phong phú hơn và ít ít hiện vật gây mất tập trung hơn”.
Google lần đầu tiên công bố công cụ Imagen 3 được nâng cấp tại sự kiện I/O vào tháng 5, nhưng chỉ mới đây công cụ này mới được cung cấp rộng rãi thông qua nền tảng Vertex AI. Theo ghi nhận của The Verge, một số người dùng Reddit đã bắt đầu thử nghiệm Imagen 3 vào tuần trước và Google cũng đã xuất bản một bài báo nghiên cứu về công cụ này vào thứ Ba.
Giống như các công cụ tạo ảnh AI khác, Imagen 3 cho phép người dùng tạo ra những hình ảnh chi tiết dựa trên yêu cầu bằng nhập văn bản. Bên cạnh đó, người dùng cũng có thể dễ dàng chỉnh sửa hình ảnh bằng cách đánh dấu khu vực cần thay đổi và mô tả mong muốn của mình.
Tuy nhiên, Imagen 3 vẫn tồn tại một số giới hạn nhất định. Cụ thể, công cụ này sẽ từ chối tạo ra hình ảnh của những người nổi tiếng, hình ảnh về vũ khí hay các nhân vật có bản quyền đã được nêu tên cụ thể. Mặc dù vậy, người dùng vẫn có thể “lách luật” bằng cách mô tả chi tiết nhân vật mong muốn thay vì đưa ra yêu cầu trực tiếp. Điều này cho thấy Imagen 3 trái ngược hoàn toàn với Grok, công cụ tạo ảnh AI trên nền tảng X của Elon Musk, có khả năng tạo ra nhiều loại nội dung nhạy cảm, bao gồm hình ảnh có ma túy, bạo lực, v.v.
Việc ra mắt Imagen 3 đánh dấu bước tiến mới trong lĩnh vực phát triển công cụ tạo ảnh AI của Google. Tuy nhiên, công ty vẫn cần tiếp tục nghiên cứu và hoàn thiện để đảm bảo tính chính xác và phù hợp cho sản phẩm của mình, đặc biệt là sau sự cố chatbot AI Gemini tạo ra những hình ảnh thiếu chính xác về mặt lịch sử hồi đầu năm 2024.