Kâr amacı gütmeyen bir yapay zeka araştırma enstitüsü olan Epoch AI tarafından gerçekleştirilen analiz, akıl yürütme yeteneği olan yapay zeka modellerinin uzun bir zaman boyunca önemli performans artışları göstermeyebileceğini ortaya koydu. Hatta bu muhakeme modellerinin gelişiminin yavaşlaması bir yılı bile bulmayabilir.
OpenAI tarafından geliştirilen o3 gibi modeller özellikle matematik ve programlama tarafına odaklanan kıyaslamalarda önemli ilerlemeler yaşandığını gün yüzüne çıkardı. Bu modeller, sorunları çözmek içi daha fazla hesaplama gücü kullanabiliyor. Bu sayede performans artıyor fakat işlemleri tamamlamaları normal modellerden daha uzun sürüyor.
Bu tür modeller önce çok büyük veri ile eğitiliyor. Daha sonra pekiştirmeli öğrenme adı verilen bir yöntemle geliştiriliyor. Bu yöntem sayesinde model, karmaşık sorulara verdiği yanıtlardan hareketle kendini geliştiriyor.
Epoch’a göre şimdiye kadar bu pekiştirmeli öğrenme kısmında çok büyük hesaplama gücü kullanmadı ama durum hızla değişiyor. OpenAI, o3 modelini bir önceki modeli o1’e göre yaklaşık 10 kat daha yüksek hesaplama gücü ile eğitti. Bu farkın büyük kısmının pekiştirmeli öğrenme aşamasına ayrılması muhtemel.
OpenAI’dan Dan Roberts’a göre şirket ileride bu yönteme çok daha fazla hesaplama gücü ayırmayı planlıyor. Öyle ki ilk eğitim aşamasından bile fazla olabilir. Yine de Epoch, bu yöntemle uygulanabilecek hesaplama gücünün bir sınırı olduğunun altını çiziyor.
Epoch’un analizi bazı varsayımlara dayanıyor. Kısmen yapay zeka şirketi tarafından kamuya yapılan açıklamalardan faydalanıyor ancak analiz, hesaplama gücünün ötesinde bazı nedenlerden ötürü akıl yürütme yeteneği olan modellerin büyümesinin zor olabileceğini gösteriyor. Bu sebeplerin başında ise tahmin edilebileceği gibi araştırma maliyetlerinin epey yüksek olması geliyor.
Akıl yürütme yeteneği olan yapay zeka modellerinin yakın zamanda sınıra ulaşabileceğine dair işaretler, bu alana büyük yatırımlar yapan yapay zeka sektörü için tehlike çanlarının çalabileceğine işaret ediyor.
Yapılan bazı araştırmalar da bu tür modelleri sunmanın oldukça pahalıya mal olduğunu ve klasik AI modellerine göre daha fazla doğru olmayan bilgi verme eğiliminde olduğunu ortaya çıkarmıştı.
Yorum Yap