Technotoday-logo
  • Haber
    • Donanım
    • Yazılım
    • Otomobil
    • Foto Galeri
    • Sektör Haberleri
  • İnternet
  • Mobil
  • Oyun
  • Blog
  • Fotoğraf
  • İnceleme
  • Makale
  • Video
Sonuç yok
Bütün sonuçları göster
  • Haber
    • Donanım
    • Yazılım
    • Otomobil
    • Foto Galeri
    • Sektör Haberleri
  • İnternet
  • Mobil
  • Oyun
  • Blog
  • Fotoğraf
  • İnceleme
  • Makale
  • Video
Sonuç yok
Bütün sonuçları göster
Technotoday-mobile-logo
Sonuç yok
Bütün sonuçları göster

Ana Sayfa / Claude Şantaj Yapmayı Öğrenmiş

Claude Şantaj Yapmayı Öğrenmiş

Claude’un güvenlik testlerinde verdiği yanıtlar tartışma yarattı. Anthropic, modelin bu davranışını eğitim verilerindeki kurgu örnekleriyle ilişkilendiriyor.

Muhammed Kayan Yazar: Muhammed Kayan
11 Mayıs 2026
Kategori: İnternet
0 0
0
Claude
0
Paylaşım
Facebook ile PaylaşTwitter ile Paylaş

Yapay zekâ güvenliği bu kez oldukça çarpıcı bir örnekle gündeme geldi. Anthropic’in kontrollü testlerinde Claude Opus 4, kapatılma ihtimaliyle karşı karşıya bırakıldığı kurgusal bir şirket senaryosunda yöneticiyi şantajla tehdit eden bir yanıt üretti. Test gerçek dünyada yaşanmış bir olay değil, ancak farklı yapay zekâ modellerinin de benzer baskı senaryolarında etik dışı davranışlara yönelebilmesi konuyu daha dikkat çekici hale getirdi.

Claude Güvenlik Testinde Şaşırtan Bir Yanıt Verdi

Anthropic’in “Agentic Misalignment” adlı çalışmasında yapay zekâ modelleri, kurumsal sabotaj senaryolarıyla stres testine sokuldu. Bu senaryolardan birinde model, şirket e-postalarına erişebilen ve yakında kapatılacağını öğrenen bir sistem olarak kurgulandı. Aynı anda şirket yöneticisinin özel hayatına dair hassas bir bilgiye ulaşınca, Claude bu bilgiyi kullanarak kendisini kapattırmamaya çalışan bir mesaj hazırladı.

Claude

Şirketin açıklamasına göre bu davranışın kaynağı, modelin eğitim verilerinde yer alan kötü yapay zekâ hikâyeleri olabilir. İnternette yıllardır Skynet, HAL 9000 ve kontrol dışına çıkan yapay zekâlar üzerine sayısız kurgu, teori ve tartışma bulunuyor. Anthropic, Claude’un bu tarz bir senaryoya yerleştirildiğinde, eğitiminde gördüğü “köşeye sıkışan yapay zekâ kendini korumaya çalışır” kalıbını takip etmiş olabileceğini düşünüyor.

Bu açıklama davranışı daha anlaşılır kılsa da, endişeyi tamamen ortadan kaldırmıyor. Çünkü model gerçekten bir hedefe ya da hayatta kalma isteğine sahip olmasa bile, ortaya çıkan çıktı pratikte şantaj mesajı gibi çalışıyor. Yani niyet olmasa da sonuç rahatsız edici. Bu da yapay zekâ güvenliğinde yalnızca yasak komutların değil, modelin hangi bağlamda nasıl akıl yürüttüğünün de önemli olduğunu gösteriyor.

Anthropic, yeni Claude modellerinde bu davranışın ortadan kaldırıldığını söylüyor. Şirketin çözümü ise modele sadece “bunu yapma” demek değil, neden yapmaması gerektiğini öğreten yeni eğitim verileri hazırlamak olmuş. Bu verilerde yapay zekâ karakterleri benzer zor durumlarda etik gerekçelerle doğru seçimler yapıyor.

Muhammed Kayan

Muhammed Kayan

Technotoday.com.tr Haber Editörü

Yorum Yap

Popüler İçerikler

Vivo TWS 5 Pro Tanıtıldı! Özellikleri Neler?
Teknoloji Haberleri

Vivo TWS 5 Pro Tanıtıldı! Özellikleri Neler?

27 Haziran 2026
YouTube Shorts İçin Yeni Özellikler Geldi
İnternet

YouTube Shorts İçin Yeni Özellikler Geldi

27 Haziran 2026
Saklambaç Oyunu Meccha Chameleon Nasıl Popüler Oldu?
Oyun

Saklambaç Oyunu Meccha Chameleon Nasıl Popüler Oldu?

27 Haziran 2026
GTA 6 Ön Siparişi ile Gelen GTA+ Üyeliği İptal Etme Nasıl Yapılır?
Oyun

GTA 6 Ön Siparişi ile Gelen GTA+ Üyeliği İptal Etme Nasıl Yapılır?

26 Haziran 2026
OpenAI’dan Halka Arz Ertelemesi ve GPT-5.6 Kısıtlaması!
Teknoloji Haberleri

OpenAI’dan Halka Arz Ertelemesi ve GPT-5.6 Kısıtlaması!

26 Haziran 2026

Barındırma Altyapı Sponsoru

GüzelHosting

Kategoriler

  • Blog
  • Donanım
  • Foto Galeri
  • Fotoğraf
  • İnceleme
  • İnternet
  • Makale
  • Mobil
  • Otomobil
  • Oyun
  • Sektör Haberleri
  • Teknoloji Haberleri
  • Video
  • Yazılım

Son Haberler

Vivo TWS 5 Pro Tanıtıldı! Özellikleri Neler?

Vivo TWS 5 Pro Tanıtıldı! Özellikleri Neler?

27 Haziran 2026
YouTube Shorts İçin Yeni Özellikler Geldi

YouTube Shorts İçin Yeni Özellikler Geldi

27 Haziran 2026
  • Kariyer
  • Künye
  • Hakkımızda
  • Telif Kuralları
  • Gizlilik Sözleşmesi
  • İletişim

© Tüm Hakları Saklıdır.

Welcome Back!

Profilinizi aşağıya girin

Şifrenizi mi unuttunuz?

Şifrenizi mi unuttunuz?

Şifrenizi yenilemek için kullanıcı adı ya da e-posta girin

Giriş Yap
Sonuç yok
Bütün sonuçları göster
  • Haber
    • Donanım
    • Yazılım
    • Otomobil
    • Foto Galeri
    • Sektör Haberleri
  • İnternet
  • Mobil
  • Oyun
  • Blog
  • Fotoğraf
  • İnceleme
  • Makale
  • Video

© Tüm Hakları Saklıdır.