Gemini 3.1 Pro Performans Testlerinde Zirvede

Gemini 3.1 Pro, paylaşılan bağımsız test sonuçlarına göre önceki sürümünü geride bırakarak zirveye yerleşti.

Yazar: Muhammed Kayan
24 dakika Önce

Google, en yeni büyük dil modeli Gemini 3.1 Pro’yu ön izleme sürümüyle kullanıma açtı. Şirket, modelin yakında genel kullanıma sunulacağını belirtirken, ilk performans verileri teknoloji dünyasında dikkat çekti. Kasım ayında tanıtılan Gemini 3 zaten güçlü bir araç olarak görülüyordu, ancak yeni sürümün önemli bir sıçrama yaptığı ifade ediliyor.

Gemini 3.1 Pro Bağımsız Testlerde Dikkat Çekti

Google’ın paylaştığı verilere göre Gemini 3.1 Pro, “Humanity’s Last Exam” gibi bağımsız kıyaslama testlerinde önceki versiyona kıyasla belirgin bir performans artışı gösterdi. Çok adımlı akıl yürütme ve karmaşık görev çözümü alanlarında elde edilen sonuçlar, modelin daha gelişmiş bir yapı sunduğuna işaret ediyor. Bu testler, özellikle profesyonel bilgi işleme kapasitesini ölçmeye odaklanıyor.

Gemini 3.1 Pro is now at the top of the APEX-Agents leaderboard. Gemini jumped from 18.4% to 33.5% on Pass@1 in just 90 days.

It also completes 5 tasks that no model has ever been able to do before.@GeminiApp shows how quickly agents are improving at real knowledge work. It… pic.twitter.com/86Q3zlUmUk

— Brendan (can/do) (@BrendanFoody) February 19, 2026

Mercor CEO’su Brendan Foody de kendi geliştirdikleri APEX-Agents sıralamasında Gemini 3.1 Pro’nun zirveye yerleştiğini açıkladı. APEX sistemi, yapay zekâ modellerinin gerçek dünyadaki profesyonel görevleri ne kadar etkin yerine getirdiğini ölçüyor. Foody’nin açıklamasına göre yeni sürüm, ajan tabanlı görevlerde hızlı bir ilerleme gösterdi.

Bu gelişme, yapay zekâ alanındaki rekabetin giderek kızıştığı bir dönemde geldi. Büyük teknoloji şirketleri, özellikle çok adımlı muhakeme ve otonom görev yürütme yeteneklerine odaklanan modeller geliştirmeye devam ediyor. Gemini 3.1 Pro’nun elde ettiği sonuçlar, Google’ın bu yarışta iddialı konumunu koruduğunu gösteriyor.

Model şu an için ön izleme aşamasında olsa da genel erişime açıldığında daha geniş kullanıcı kitlesi tarafından test edilecek. Performans verileri, Gemini 3.1 Pro’nun yapay zekâ rekabetinde yeni bir referans noktası oluşturabileceğine işaret ediyor.

Categories: İnternet

Gemini 3.1 Pro Bağımsız Testlerde Dikkat Çekti

Alakalı içerikler

Meta, Messenger'ın Sitesini Kapatıyor! Şimdi Ne Olacak?

Google Artık Tek Tıkla Bilgilerinizi Kaldırmanızı Sağlıyor

Threads'te Akıllı Öneriler Dönemi Başlıyor

Bazı Disney+ Kullanıcıları, Dolby Vision Desteğini Kaybetti

Netflix Zirvedeki Yerini Bırakacak Gibi Durmuyor

Anthropic OpenAI’yi Tiye Alan Reklamlar İçin Milyonlar Harcadı