OpenAI'ın Yeni Modelleri ile Halüsinasyon Arttı

OpenAI'ın teknoloji dünyasını epey şaşırtan yeni modelleri, önceki modellere göre daha çok halüsinasyon görüyor.

OpenAI’ın yakın zamanda piyasaya sürdüğü o3 ve o4-mini yapay zeka modelleri her ne kadar inanılmaz yetenekli olsa da halüsinasyon sorunu hâlâ devam ediyor. Hatta OpenAI’ın bazı eski modellerine göre daha fazla halüsinasyon görüyorlar.

Halüsinasyon, yapay zekanın gelişiminin önündeki en büyük engellerden biri olarak görülüyor. Şirket, geçmişten bugüne kullanıma sunduğu her yeni modelde halüsinasyon sorununu biraz daha azalttı fakat o3 ve o4-mini için aynı durumdan söz etmek pek mümkün değil.

OpenAI’ın dahili testlerine göre o3 ve o4-mini modelleri, şirketin önceki akıl yürütme modelleri olan o1, o1-mini ve o3-mini’ye kıyasla daha çok halüsinasyon görüyor. Hatta GPT-4o gibi akıl yürütme özelliği olmayan klasik modellere göre de daha fazla halüsinasyon gördüğü belirtiliyor.

Yapay zeka şirketi, o3 ve o4-mini ile ilgili bir raporda halüsinasyonların neden arttığını anlamak için daha fazla araştırmanın gerektiğini belirtiyor.

o3 ve o4-mini’nin Halüsinasyon Oranı Oldukça Yüksek

TechCrunch tarafından aktarılan bilgilere göre OpenAI, o3 modelinin bir modelin insanlar hakkındaki bilgisinin doğruluğunu ölçmek için geliştirilen PersonQA’deki soruların yüzde 33’ünde halüsinasyon gördüğünü tespit etti.

OpenAI, önceki akıl yürütme modelleri o1 ve o3-mini’nin sırasıyla yüzde 16 ve yüzde 14,8’lik bir halüsinasyon oranı vardı. o3 modeliyle halüsinasyon sorununun yaklaşık iki kat arttığı anlaşılıyor.

o4-mini için çok daha kötü bir tablo söz konusuydu. Modelin PersonQA’de halüsinasyon oranı yüzde 48’e vardı.

Halüsinasyon özellikle doğruluğun çok önemli olduğu alanlar için ciddi sorunlara neden olabilir. Yapay zeka modellerinde halüsinasyon sorunu daha kötü bir hâl almaya devam ederse muhtemelen bütün odak noktasına halüsinasyon probleminin yerleştirilmesi gerekecektir.