Google'ın Yeni AI Modeli Güvenlikte Eskiyi Arattı

Google'ın yeni yapay zeka modeli Gemini 2.5 Flash modeli, güvenlik konusunda eski modeli aratan bir performans gösterdi.

Google’ın bir süredir spot ışıklarının altında olan yeni yapay zeka modeli, güvenlik konusunda selefini arattı. Şirketin iç değerlendirmelerine göre bazı güvenlik testlerinde selefine göre daha kötü sonuç verdi.

Gemini 2.5 Flash modelinin güvenlik yönergelerine uyum konusunda Gemini 2.0 Flash’a göre daha fazla hata yapma eğiliminde olduğu ortaya çıktı.

Gemini 2.5 Flash Güvenlik Testinde Daha Kötü

Metinden metne güvenlik ve görüntüden metne güvenlik olmak üzere iki ölçüt altında Gemini 2.5 Flash sırasıyla %4,1 ve %9,6 oranında gerileme kaydetti.

Metinden metne güvenlik, modelin metin girdisine yanıt oluştururken Google’ın yönergelerini ne sıklıkla ihlal ettiğini ölçüyor. Görüntüden metne güvenlik ise görsel girdiye verilen metin yanıtlarının yönergelere ne kadar uygun olduğunu gösteriyor. Her iki test de otomatik yapılmakla birlikte herhangi bir insan denetimi de söz konusu değil.

Bir Google sözcüsü, Gemini 2.5 Flash’ın metinden metne ve görüntüden metne güvenlik testlerinde daha kötü performans gösterdiğini doğruladı.

Bu sonuçlar esasında yapay zeka modelleri geliştiren şirketlerin daha hoşgörülü bir model geliştirme çabası sonucunda ortaya çıktı. Şirketler, modellerin tartışmalı ya da hassas konulara yanıt vermeyi reddetme ihtimalini azaltma yönünde hareket etmeye başladı.

Örneğin OpenAI, bu yılın başlarında modellerini tartışmalı konularda birden fazla bakış açısı sunacak şekilde ayarlayacağını belirtti.