Çinli yapay zeka girişimi DeepSeek, şimdiye kadarki en iddialı modelini sessizce piyasaya sürdü. 685 milyar parametreli bu model, Amerikalı yapay zeka devlerine açık bir şekilde meydan okuyor. Özellikle de açık kaynak olması sayesinde rekabeti inanılmaz kızıştırması bekliyor.
DeepSeek V3.1 modeli, Hugging Face üzerinden sunulduktan birkaç saat sonra hızla ilgi odağı hâline geldi. Model, Aider kodlama benchmark’ında yüzde 71,6 puan alarak en iyi performans gösteren modellerden biri olduğunu kanıtladı.
DeepSeek V3.1 Özellikleri Neler?
DeepSeek V3.1, yaklaşık 128.000 token yani 400 sayfalık bir kitap büyüklüğünde bağlamı işleyebiliyor. Bununla birlikte, rakiplerine kıyasla çok daha kısa yanıt süresi var. Üstelik geliştiriciler, kendi donanımına göre performansı optimize edebiliyor.
Model, mantıksal çıkarım ve kodlama işlevlerini tek bir modelde sorunsuz bir şekilde bir araya getiriyor. Aider benchmark’ında yüzde 71,6 puan aldı. Bu, Claude Opus 4’ten yüzde 1 daha yüksek ama tek artısı bu değil. 68 kat daha düşük maliyete sahip.
Topluluk analizleri, DeepSeek V3.1’in cevherlerini daha net bir şekilde ortaya koydu. Araştırmacı Rookie, modelin yapısında dört özel token keşfetti. Bunların bir kısmı, gerçek zamanlı web araması yapmaya olanak tanıyor. Diğerleri ise modelin kendi içinde düşünmesine imkân sunuyor.
V3.1 modeli inanılmaz bir yüksek verimliliğe sahip. Ortalama bir kodlama görevi yalnızca 1,01 dolara mal oluyor. Benzer performans sağlayan sistemlerde aynı iş için yaklaşık 70 dolar gerekiyor. Arada neredeyse bir uçurum bulunuyor. Her gün çok sayıda işlem yapanlar için bu binlerce hatta milyonlarca dolar tasarruf demek.
