OpenAI, neredeyse 2 hafta süren ve her birinde teknoloji tutkunlarını heyecanlandırmayı başaran duyuruların ardından sonunda yapay zekanın sınırlarını zorlayan yeni modelini gösterdi.
Normalde bu modelin o2 olarak adlandırılması beklenebilir ancak OpenAI, o2 yerine (Telefónica’dan kaynaklı) o3 ismini kullanıyor. Yeni model şu anda herkesin kullanımına açık değil. Şirket, o3 modelini ilk olarak güvenlik testlerinden geçirmeyi planlıyor.
OpenAI ayrıca o3-mini modelini de duyurdu. Altman, şirketin bu modeli ocak ayının sonunda piyasaya sürmeyi planladığını belirtti. Ayrıca o3’ün de o3-mini piyasaya sürüldükten kısa bir süre genel kullanıma açılacağını ifade etti.
o3 Modeli Ne Kadar İyi?
o3 elbette önceki modellere göre çok iyi performans gösteriyor. Model, bu yılki AIME (American Invitational Mathematics Examination) sınavına tabi tutuldu. o3 yüzde 96,7’lik bir doğruluk elde ederken o1 ise yüzde 83,3’lik başarı gösterdi.
OpenAI’dan Mark Chen, “Bu, o3’ün sadece bir soruyu kaçırdığı anlamına geliyor” dedi. OpenAI, o3 modelini diğer modellerle kıyaslamak için daha zorlu testler bulmak zorunda kaldı.
Bunlardan biri, yapay zekanın olayları ne kadar iyi öğrenebildiğini ve anlayabildiğini ortaya çıkarmak için uygulanan bir test olan ARC-AGI. Bu test, kâr amacı gütmeyen ARC Prize tarafından yaratıldı. Bir yapay zeka modeli bunu geçebilirse bunun yapay genel zekaya doğru büyük bir adım olacağını belirtiyor.
Test çoğu insanın kolaylıkla çözebileceği sorulardan oluşuyor ve o3 modeli, düşük işlem ayarlarında yüzde 75,7’lik başarı elde etti. Ek işlem gücü ile bu başarı oranı yüzde 87,5’e çıktı. ARC Prize Foundation Başkanı Greg Kamradt, insan performansının yüzde 85’le karşılaştırılabilir olduğunu, bunun üzerine çıkmanın önemli bir kilometre taşı olduğunu söyledi.
Yorum Yap