xAI’ın Grok’u Görüntü İşleme Özelliği Kazanıyor

xAI, Grok'un görüntü işleme özelliği içeren ilk sürümünü tanıttı. Peki, bu özellik gerçek hayatta nasıl faydalı şekilde kullanılabilecek?

xAI'ın Grok'u Görüntü İşleme Özelliği Kazanıyor

Elon Musk’ın kurduğu OpenAI rakibi xAI, Grok’un görüntü işleme özelliğini içeren ilk versiyonu tanıttı. Grok-1.5V, şirketin sadece metni değil aynı zamanda belgeleri, grafikleri, ekran görüntülerini ve fotoğrafları da işlediği çok modlu yapay zeka modeli ile destekleniyor.

xAI, yaptığı duyuruda yeni yeteneklerin gerçek dünyada nasıl kullanılabileceğine dair birkaç örnek verdi. Örneğin ona bir şemanın fotoğrafını verebilir ve bunu Python koduna dönüştürmesini isteyebilirsiniz. Hatta anlamadığınız bir caps’i açıklamasını bile sağlayabilirsiniz.

Yeni sürüm, şirketin Grok-1.5’i tanıtmasından sadece birkaç hafta sonra geliyor. Bu model, kodlama ve matematik konularına önceki modele göre daha iyi performans gösterecek. Belirli sorguları daha iyi anlamak için daha fazla kaynaktan gelen verileri kontrol edebilmek amacıyla daha uzun bağlamları işleyebilecek şekilde tasarlandı.

Yapay zeka şirketi, ilk başta uzmanlarla test edileceğini, kullanıcılarınsa yakında Grok-1.5V’nin özelliklerinden yararlanabileceğini söyledi fakat özelliğin ne zaman kullanıma sunulacağı hakkında kesin bir tarih vermedi.

xAI’ın Grok-1.5V’si En Yüksek Puanı Aldı

Şirket, Grok-1.5V’yi tanıtırken RealWorldQA adı verilen bir kıyaslama veri seti de yayımladı. Yapay zeka modellerini değerlendirmek için RealWorldQA’nın 700 görüntüsünden herhangi biri kullanılabiliyor. Her görüntü, kolaylıkla doğrulanabilecek soru ve yanıtlarla birlikte geliyor ancak bunlar Grok gibi çok modlu modelleri şaşırtabiliyor.

xAI, RealWorldQA ile OpenAI’ın GPT-4V ve Google Gemini Pro 1.5 gibi rakiplerine karşı test ettiğinde teknolojisinin en yüksek puanı aldığını öne sürdü.

Exit mobile version