Technotoday-logo
  • Haber
    • Donanım
    • Yazılım
    • Otomobil
    • Foto Galeri
    • Sektör Haberleri
  • İnternet
  • Mobil
  • Oyun
  • Blog
  • Fotoğraf
  • İnceleme
  • Makale
  • Video
Sonuç yok
Bütün sonuçları göster
  • Haber
    • Donanım
    • Yazılım
    • Otomobil
    • Foto Galeri
    • Sektör Haberleri
  • İnternet
  • Mobil
  • Oyun
  • Blog
  • Fotoğraf
  • İnceleme
  • Makale
  • Video
Sonuç yok
Bütün sonuçları göster
Technotoday-mobile-logo
Sonuç yok
Bütün sonuçları göster

Ana Sayfa / Claude Şantaj Yapmayı Öğrenmiş

Claude Şantaj Yapmayı Öğrenmiş

Claude’un güvenlik testlerinde verdiği yanıtlar tartışma yarattı. Anthropic, modelin bu davranışını eğitim verilerindeki kurgu örnekleriyle ilişkilendiriyor.

Muhammed Kayan Yazar: Muhammed Kayan
11 Mayıs 2026
Kategori: İnternet
0 0
0
Claude
0
Paylaşım
Facebook ile PaylaşTwitter ile Paylaş

Yapay zekâ güvenliği bu kez oldukça çarpıcı bir örnekle gündeme geldi. Anthropic’in kontrollü testlerinde Claude Opus 4, kapatılma ihtimaliyle karşı karşıya bırakıldığı kurgusal bir şirket senaryosunda yöneticiyi şantajla tehdit eden bir yanıt üretti. Test gerçek dünyada yaşanmış bir olay değil, ancak farklı yapay zekâ modellerinin de benzer baskı senaryolarında etik dışı davranışlara yönelebilmesi konuyu daha dikkat çekici hale getirdi.

Claude Güvenlik Testinde Şaşırtan Bir Yanıt Verdi

Anthropic’in “Agentic Misalignment” adlı çalışmasında yapay zekâ modelleri, kurumsal sabotaj senaryolarıyla stres testine sokuldu. Bu senaryolardan birinde model, şirket e-postalarına erişebilen ve yakında kapatılacağını öğrenen bir sistem olarak kurgulandı. Aynı anda şirket yöneticisinin özel hayatına dair hassas bir bilgiye ulaşınca, Claude bu bilgiyi kullanarak kendisini kapattırmamaya çalışan bir mesaj hazırladı.

Claude

Şirketin açıklamasına göre bu davranışın kaynağı, modelin eğitim verilerinde yer alan kötü yapay zekâ hikâyeleri olabilir. İnternette yıllardır Skynet, HAL 9000 ve kontrol dışına çıkan yapay zekâlar üzerine sayısız kurgu, teori ve tartışma bulunuyor. Anthropic, Claude’un bu tarz bir senaryoya yerleştirildiğinde, eğitiminde gördüğü “köşeye sıkışan yapay zekâ kendini korumaya çalışır” kalıbını takip etmiş olabileceğini düşünüyor.

Bu açıklama davranışı daha anlaşılır kılsa da, endişeyi tamamen ortadan kaldırmıyor. Çünkü model gerçekten bir hedefe ya da hayatta kalma isteğine sahip olmasa bile, ortaya çıkan çıktı pratikte şantaj mesajı gibi çalışıyor. Yani niyet olmasa da sonuç rahatsız edici. Bu da yapay zekâ güvenliğinde yalnızca yasak komutların değil, modelin hangi bağlamda nasıl akıl yürüttüğünün de önemli olduğunu gösteriyor.

Anthropic, yeni Claude modellerinde bu davranışın ortadan kaldırıldığını söylüyor. Şirketin çözümü ise modele sadece “bunu yapma” demek değil, neden yapmaması gerektiğini öğreten yeni eğitim verileri hazırlamak olmuş. Bu verilerde yapay zekâ karakterleri benzer zor durumlarda etik gerekçelerle doğru seçimler yapıyor.

Muhammed Kayan

Muhammed Kayan

Technotoday.com.tr Haber Editörü

Yorum Yap

Popüler İçerikler

Delta Force benzeri oyunlar
Oyun

Delta Force Benzeri Oyunlar

12 Mayıs 2026
Apple Watch Series 12 İçin Hayal Kırıklığı Yaratan İddia
Teknoloji Haberleri

Apple Watch Series 12 İçin Hayal Kırıklığı Yaratan İddia

12 Mayıs 2026
Aliens: Fireteam Elite 2’nin Sistem Gereksinimleri Belli Oldu
Oyun

Aliens: Fireteam Elite 2’nin Sistem Gereksinimleri Belli Oldu

12 Mayıs 2026
Vivo Y60 Tanıtıldı! Fiyatı Ne Kadar?
Mobil

Vivo Y60 Tanıtıldı! Fiyatı Ne Kadar?

12 Mayıs 2026
Yapay Zekâ Arkadaşlar Sosyal Boşluğu Giderek Daha Fazla Dolduruyor
Teknoloji Haberleri

Yapay Zekâ Arkadaşlar Sosyal Boşluğu Giderek Daha Fazla Dolduruyor

12 Mayıs 2026

Barındırma Altyapı Sponsoru

GüzelHosting

Kategoriler

  • Blog
  • Donanım
  • Foto Galeri
  • Fotoğraf
  • İnceleme
  • İnternet
  • Makale
  • Mobil
  • Otomobil
  • Oyun
  • Sektör Haberleri
  • Teknoloji Haberleri
  • Video
  • Yazılım

Son Haberler

Delta Force benzeri oyunlar

Delta Force Benzeri Oyunlar

12 Mayıs 2026
Apple Watch Series 12 İçin Hayal Kırıklığı Yaratan İddia

Apple Watch Series 12 İçin Hayal Kırıklığı Yaratan İddia

12 Mayıs 2026
  • Kariyer
  • Künye
  • Hakkımızda
  • Telif Kuralları
  • Gizlilik Sözleşmesi
  • İletişim

© Tüm Hakları Saklıdır.

Welcome Back!

Profilinizi aşağıya girin

Şifrenizi mi unuttunuz?

Şifrenizi mi unuttunuz?

Şifrenizi yenilemek için kullanıcı adı ya da e-posta girin

Giriş Yap
Sonuç yok
Bütün sonuçları göster
  • Haber
    • Donanım
    • Yazılım
    • Otomobil
    • Foto Galeri
    • Sektör Haberleri
  • İnternet
  • Mobil
  • Oyun
  • Blog
  • Fotoğraf
  • İnceleme
  • Makale
  • Video

© Tüm Hakları Saklıdır.