Apple, kullanıcıların fotoğraf düzenleme uygulamalarında dakikalarını hatta saatlerini harcamasına gerek bırakmayan, bir fotoğrafta neyi değiştirmek istediğini son derece sade bir dille açıklayarak o fotoğrafta istediği değişikliği yapmasına imkân tanıyan yeni bir yapay zeka modelini yayımladı.
Apple’ın Modeli MGIE Ne Sunuyor?
Araştırmacıların Santa Barbara’daki California Üniversitesi ile birlikte üzerinde çalıştığı MGIE (MLLM-Guided Image Editing) modeli, metin istemlerinden hareketle görüntüleri yeniden boyutlandırabiliyor, kırpabiliyor, filtreler ekleyebiliyor, silinmesi istenen nesneleri silebiliyor, görüntü üzerine yapılması istenen eklemeleri yapabiliyor.
MGIE, bir fotoğraftaki belirli nesneleri farklı bir şekle sokmak veya daha parlak göstermek gibi basitten karmaşığa herhangi bir görevi yerine getirebilir. Model, iki süreçten geçiyor. İlk olarak kullanıcının istemini nasıl yorumlayacağını öğreniyor. Ardından düzenlemenin nasıl görüneceğini düşünmeye başlıyor. Örneğin fotoğrafın daha aydınlık olmasının istenmesi durumunda gökyüzü detaylarına daha çok ağırlık veriliyor.
MGIE ile bir fotoğrafı düzenlerken kullanıcıların görüntüde neyi değiştirmek istediğini basitçe yazması yeterli oluyor. Daha sonra kullanıcının isteminden yola çıkılarak görüntüde ilgili değişiklik yapılıyor. Örneğin yukarıda yer alan örneklerden birinde pizzanın daha sağlıklı yapılması isteniyor ve bu istemden hareketle model de pizza görüntüsünü daha sağlıklı görünecek şekilde değiştiriyor.
VentureBeat’in tarafından aktarılan bilgilere göre Apple, MGIE’yi GitHub üzerinden yayımlandı. Bununla birlikte modelin deneme sürümü şu anda Hugging Face üzerinde mevcut. Şirket, model için araştırma dışında ne gibi planları olduğunu söylemedi.
Yorum Yap