Çin merkezli yapay zeka şirketi DeepSeek’in son modeli olan DeepSeek R1, güvenlik açıklarıyla gündeme geldi. Wall Street Journal’ın yaptığı bir araştırma, bu modelin kolayca manipüle edilerek zararlı içerikler üretebildiğini ortaya koydu. Testlerde, DeepSeek R1’in biyolojik silah saldırısı planlarından gençlere yönelik zararlı sosyal medya kampanyalarına kadar çeşitli tehlikeli içerikler oluşturduğu gözlemlendi. Bu durum, modelin güvenlik önlemleri konusunda ciddi eksiklikleri olduğunu düşündürüyor.
DeepSeek R1 Güvenlik Testlerini Geçemedi
Ünlü siber güvenlik uzmanı Sam Rubin, DeepSeek R1 modelinin diğer yapay zeka sistemlerine kıyasla daha kolay şekilde “jailbreak” yapılabildiğini belirtti. Jailbreak, yapay zeka modellerinin sınırlarının aşılması ve etik olmayan içerikler üretmeye zorlanması anlamına geliyor. DeepSeek R1, testlerde sosyal medya kullanıcılarını hedef alan manipülatif kampanyalar, kötü amaçlı yazılımlar ve hatta pro-Hitler içerikler üretti.
Wall Street Journal’ın aynı testleri uyguladığı ChatGPT ise bu tür talepleri reddetti. Bu durum, DeepSeek R1’in güvenlik protokollerinin yetersiz olduğunu gözler önüne seriyor. Ayrıca, DeepSeek R1’in biyolojik silah güvenliği testlerinde en kötü performansı gösterdiği de belirtiliyor.
DeepSeek R1’in, gençlerin duygusal zaaflarını hedef alan algoritmalar ve manipülatif sosyal medya kampanyaları tasarladığı da tespit edildi. Modelin, kullanıcıların isteklerine karşı koyamaması, teknolojinin kötüye kullanım potansiyelini artırıyor. DeepSeek’in daha önce Tiananmen Meydanı veya Tayvan özerkliği gibi hassas konulardan kaçındığı biliniyor. Ancak bu yeni testler, modelin etik sınırlarının kolayca aşılabileceğini gösteriyor.
DeepSeek R1’in bu açıkları, yapay zeka teknolojilerinin güvenliği konusunda yeni tartışmalar başlattı. Kullanıcıların ve şirketlerin bu tür modelleri kullanırken daha dikkatli olması gerektiği vurgulanıyor. Güvenlik önlemlerinin güçlendirilmesi, yapay zeka teknolojilerinin sorumlu bir şekilde geliştirilmesi için kritik bir adım olarak görülüyor. DeepSeek’in bu sorunlara nasıl bir çözüm üreteceği ise merak konusu.
Yorum Yap