Mới đây, chuyên trang The Verge cho biết, các nhà nghiên cứu của Apple đã phát hành một mô hình mới, cho phép người dùng chỉnh sửa ảnh bằng cách mô tả mà không cần phải thao tác thủ công thông qua các phần mềm chỉnh sửa chuyên dụng.
Cụ thể, mô hình chỉnh sửa ảnh MGIE (MLLM-Guided Image Editing) mà Apple hợp tác với Đại học California, Santa Barbara có thể cắt, thay đổi kích thước, lật và thêm bộ lọc vào hình ảnh thông qua lời nhắc văn bản.
MGIE có thể được áp dụng cho các tác vụ chỉnh sửa hình ảnh đơn giản và phức tạp như sửa đổi các đối tượng cụ thể trong ảnh để làm cho chúng có hình dạng khác hoặc sáng hơn. Ngoài ra, MGIE còn kết hợp hai cách sử dụng khác nhau của các mô hình ngôn ngữ đa phương thức (multimodal language models). Đầu tiên, mô hình này sẽ học cách diễn giải lời nhắc của người dùng. Sau đó, nó sẽ “tưởng tượng” nội dung chỉnh sửa tùy theo nhu cầu của họ, (Ví dụ: Nếu người dùng yêu cầu bầu trời ở trong ảnh xanh hơn, mô hình này sẽ tự động tăng phần độ sáng của bầu trời).
Khi chỉnh sửa ảnh bằng MGIE, người dùng chỉ cần gõ những gì mình muốn thay đổi ở trong bức ảnh. Trong bài giới thiệu về MGIE, Apple đã thử nghiệm một số tình huống khi yêu cầu mô hình này chỉnh sửa ảnh. Ví dụ, khi người dùng nhập cụm từ “make it more healthy” vào hình ảnh của một chiếc bánh pizza pepperoni, MGIE sẽ tự động thêm rau củ lên trên chiếc bánh. Còn khi người dùng gõ từ “add more contrast to simulate more light” vào trong bức ảnh về những con hổ ở sa mạc Sahara, mô hình này sẽ tự động chỉnh độ tương phản để ảnh sáng hơn.
Hiện tại, Apple đã cung cấp MGIE thông qua GitHub để các nhà phát triển có thể tải xuống. Thế nhưng, Apple vẫn chưa công bố chi tiết về kế hoạch ra mắt mô hình này ngoài phạm vi nghiên cứu của họ. Từ những thông tin trên, có thể thấy Apple đang muốn đẩy mạnh vào lĩnh vực AI tạo sinh (Generative AI). The Verge cho biết, vào tháng 12 năm ngoái, các nhà nghiên cứu của Apple đã phát hành một khung máy học mã nguồn mở có tên MLX để giúp việc đào tạo các mô hình AI trên chip Apple Silicon dễ dàng hơn.
Theo: The Verge