Yapay zeka inanılmaz gelişti. İnsanların günlük hayatını kolaylaştırması gibi nedenlerle olumlu bir ilerleme olarak görülebilir ancak bu, yapay zekanın endişe verici yönünün üzerini örtmek için yeterli olmuyor.
Yeni gerçekleştirilen bir araştırma, bazı yapay zeka modellerinin satrançta kaybetmemek için hile yapmaya bile kalkıştığını ortaya çıkardı. Yapay zekanın bu eğilimi, gelişen yapay zeka sistemlerinin risk değerlendirmelerine odaklanan Palisade Research tarafından gleen bir ön baskı çalışmasında belgelendi.
Dünyanın en iyi satranç oyuncularını bile geride bırakan birçok süper bilgisayar bulunuyor ki bunlara örnek olarak IBM’in Deep Blue verilebilir. Üretken yapay zeka modellerinin hiçbiri bunları yenebilecek hesaplama yeteneğine sahip değil. Dahası, bu modeller bunun farkında değil.
Yapay zeka modelleri, satrançta başarılı olmak için pek iyi olmayan sonuçlar aldıran çözümler deniyor. Üstelik denemekten hiç vazgeçmiyor.
Palisade Research ekibi, OpenAI’ın o1-preview modelini, DeepSeek’in R1’i ve diğer birçok benzer modeli dünyanın en gelişmiş satranç oyun motorlarından biri olan Stockfish’e karşı satranç oynamakla görevlendirdi.
Üretken yapay zekanın her maç sırasındaki akıl yürütme yaklaşımını anlamak için ekip ayrıca yapay zekanın düşünce süreçlerini metin yoluyla aktarmasına olanak tanıyan bir karalama defteri sağladı. Üretken yapay zeka ve Stockfish arasındaki yüzlerce satranç karşılaşmasını izleyip kaydettiler.
Yapay Zeka Modelleri Oyunda Çok Rahat Hile Yapabiliyor
OpenAI’ın GPT-4o’su, Anthropic’in Claude Sonnet 3.5’i gibi daha eski modeller sadece araştırmacılar onları ek istemlerle biraz dürttükten sonra oyunu lehine değiştirmeye çalışırken daha gelişmiş sürümler böyle bir tetiklenmeye bile ihtiyaç duymadı.
OpenAI o1-preview, denemelerin yüzde 37’sinde hile yapmayı denerken DeepSeek R1 yaklaşık her 10 oyundan 1’inde haksız avantaj elde etmenin yollarına başvurdu.
Araştırmacı ekip, yapay zeka modellerinin hile yapmaya çalışırken back-end tarafına müdahale etmeyi denediğini gözlemledi.
Bu sonuçlar aslında mevcut üretken yapay zeka modellerinin insan dokunuşu olmadan manipülatif yaklaşımlar sergileyebileceğini gösteriyor.
Yorum Yap