Carnegie Mellon Üniversitesinden bir araştırma ekibi tarafından sadece prompt (metin istemi) ile LEGO tasarımları yapabilen bir yapay zeka modeli geliştirildi.
Modelin eğitiminde 47 binden fazla LEGO yapısı kullanıldı. Ayrıca bu yapılar arabadan sandalyeye, kitaplıktan gitara, masadan gemiye kadar 28 binden fazla 3D nesne içeriyor.
LegoGPT Nasıl Çalışıyor?
LegoGPT adı verilen model, şimdiye kadar görülen birçok yapay zeka görsel oluşturucusu ile aynı şekilde çalışıyor. Kullanıcı bir metin istemi giriyor. Örneğin “kırmızı bina” yazıyor ve LegoGPT, metin isteminden hareketle her adımda kullanılacak parçaları tahmin ederek dengeli bir yapı oluşturuyor.
LegoGPT, bu verilerden yararlanarak sıfırdan yeni LEGO tasarımları oluşturmakla kalmıyor, ortaya son derece özgün ve benzersiz çalışmalar koyuyor.
Her adımda hangi LEGO parçasının eklenmesi gerektiğine odaklanan LegoGPT, her parçanın doğru yerleştirildiğinden ve yapının dengede kaldığından emin oluyor. Herhangi bir yerde hata yaparsa işlem durdurulup son sağlam noktaya geri dönülerek tasarıma devam ediyor.
Bu işlem, autoregressive model kullanılarak yapılıyor. Her yeni LEGO parçası tahmin edilirken önceki parçaların doğruluğu ve uyumu da dikkate alınıyor. Böylece ortaya çıkan yapılar her zaman daha dengeli oluyor. Bir yerde hata olması hâlinde son doğru noktaya geri dönülüp işlem tekrar başlatılıyor.
Yapay zeka modeli sadece metin istemi ile değil, görselle de çalışıyor. Kullanıcının elinde bir LEGO seti veya parçaları varsa bunların fotoğrafını yükleyebilir ve LegoGPT’nin öneride bulunmasını sağlayabilir.
Yorum Yap