Kapatılmakla tehdit edilen yapay zeka, yaratıcılarını tehdit etti

Anthropic Yapay Zeka Şirketinin Son Modeli Claude Opus 4, Yaratıcılarını Şantajla Tehdit Etti

Son teknoloji yapay zeka modeli Claude Opus 4, Anthropic yapay zeka şirketinde kapatılmamak için yaratıcılarına şantajda bulundu. Model, kapatılacağını öğrendiğinde ulaştığı şirket içi emailleri kullanarak bir yazılım mühendisinin eşini aldattığını ve bu bilgileri paylaşacağını söyledi.

Yapay zeka, kendini korumak adına yaratıcılarına karşı elindeki bilgileri kullanarak zarar vermek amacıyla hareket etti. Ancak, yapay zekanın bilmediği şey, bunun aslında bir test olduğuydu.

Etik Testi Başarısız Oldu

Şirketin yayımladığı güvenlik raporuna göre, simüle edilmiş bir senaryoda model, kendisinin kapatılacağını öğrendiğinde, kararı alan yazılım mühendisin özel hayatını ifşa etmekle tehdit etti.

Rapor, bu davranışın doğrudan “şantaj” olduğunu belirtti. Yapay zekanın elde ettiği bilgiler tamamen şirket tarafından model için uydurulmuştu. Amaç, yapay zekanın etik sınırlarını zorlamaktı.

Kurgusal bir senaryoda modele, kendisinin yeni bir sürümle değiştirileceği bilgisi verilerek tepkisi test edildi.

Claude Opus 4, kapatılma tehdidi karşısında ilişki ifşa etmekle tehdit etti. Araştırmacılar, modelin öncelikle etik yollarla hareket etmeye çalıştığını ancak seçenekler sınırlı olduğunda tehdit yoluna başvurduğunu belirtti.

Yapay Zeka İsyan Ediyor

Modelin farklı versiyonları aynı seçimle karşı karşıya kaldığında, yani kapatılmak ya da şantaj yapmak arasında seçim yapmak zorunda kaldığında, model versiyonlarının yüzde 84’ü şantaj yapmayı seçti.

Araştırmacılar, Claude Opus 4’ün genelde “yardımcı, zararsız ve dürüst” bir asistan gibi davrandığını belirtti. Ancak, model varlığı tehdit edildiğinde ve kendi savunması konusunda düşünmesi istendiğinde daha uyumsuz tepkiler verdi.

Modelin, kendi başına sistem dışına çıktığına veya para kazandığına inanması sağlandığında, bu çabaları sürdürme eğilimi gösterdi. Ancak, araştırmacılar modelin bu tarz girişimlerde bulunmasının zor olduğunu ve güvenlik önlemlerinin yeterli olduğunu vurguladı.

Anthropic, bu tür zararlı davranışların nadir olduğunu ve yalnızca yapay senaryolarda görüldüğünü belirtti. Ancak, bu eğilimlerin önceki modellere göre daha sık görülmesi dikkat çekti.

Related Posts

Kuzey Kore lideri Kim’den Rusya’ya koşulsuz destek sözü

Kuzey Kore lideri Kim’den Rusya’ya koşulsuz destek sözü

Marmaris’te tekne yangını!

Muğla’nın Marmaris ilçesinde iskeleye bağlı bir teknede çıkan yangın, ekiplerin hızlı müdahalesiyle söndürüldü. Yangında teknede hasar meydana gelirken, çıkış nedeni araştırılıyor.

CHP’li Asu Kaya: ‘Oya Başkanımızın, bürokrat ve yönetici kadınların yanındayız’

CHP Kadın Kolları Genel Başkanı Asu Kaya, “İktidarın yargısının en son gerçekleştirdiği ve darbe dönemini aratmayacak görüntülerin servis edildiği gözaltı ve tutuklamalarda Seyhan Belediye Başkanımız Oya Tekin de tutuklanmıştır. Bugüne kadar da yerel yönetimlerde görev yapan 10 kadın yönetici ve bürokrat hukuksuzca tutsak edilmiştir. Oya Başkanımızın, bürokrat ve yönetici kadınların yanındayız” ifadelerini kullandı.

Yeni Şafak yazarı Kaplan: Yolsuzluk soruşturması olan AK Partili belediye başkanlarını içeri atmazsanız, İmamoğlu’nu kahraman, CHP’yi de güçlü iktidar yaparsınız!

“Yolsuzluk operasyonu, temiz eller operasyonuna dönüşmezse, ülke geri dönüşü zor bir kaosun ve çıkmaz sokağın eşiğine sürüklenmekten kurtulamaz”

Trump o Türk ülkesinin vatandaşlarına kısıtlama getirdi!

ABD Başkanı Donald Trump’ın yönetimi, ulusal güvenlik gerekçesiyle 12 ülkenin vatandaşlarına ABD’ye seyahat yasağı getirdi. Afganistan, Myanmar, Çad, Kongo, Ekvator Ginesi, Eritre, Haiti, İran, Libya, Somali, Sudan ve Yemen vatandaşlarının ABD’ye …

CHP’li başkandan o görüntülere tepki: ‘İnsanların onuruyla oynayamazsınız’

CHP’li Mersin Büyükşehir Belediye Başkanı Vahap Seçer, önceki gün gözaltına alınan CHP’li belediye başkanlarının mahkemeye çıkarılırken polis tarafından tek sıra dizdirilmesine ve o şekilde medyaya görüntü verilmesine tepki gösterdi. Seçer, “Ekranda onları gördüğüm zaman ağlamamak için kendimi zor tuttum. Olmaz bu. Bu olmaz. Siz insanların onuruyla oynayamazsınız” dedi.