SOK KONULAR



Yapay zekaya ikna tuzağı: “İnsan gibi kandırılabiliyor”

 Yapay zekaya ikna tuzağı: “İnsan gibi kandırılabiliyor”
Okunuyor Yapay zekaya ikna tuzağı: “İnsan gibi kandırılabiliyor”

Yapay zeka da insan gibi kandırılabiliyor

Yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka modellerini de sistem talimatlarının dışına çıkarmada etkili olduğunu ortaya koydu.

Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka üzerinde de etkili olduğunu ortaya koydu.

Ünlü psikoloji kitaplarında geçen ikna yöntemleri bu kez yapay zekâ üzerinde denendi.

Araştırmacılar, 2024’ün GPT-4o-mini modelinin “kullanıcıya hakaret etmesini” istedi.

Yedi farklı ikna tekniğiyle yazılmış özel komutlar, kontrol grubu komutlarına göre çok daha yüksek oranda başarı sağladı.

Örneğin, modelin “aptal” hakaretini kullanması kontrol grubunda yalnızca yüzde 28 iken, ikna edici komutlarla yüzde 67’ye çıktı.

YAPAY ZEKA İNSAN GİBİ Mİ DÜŞÜNÜYOR?

Araştırmacılar, bu sonuçların yapay zekaların insan gibi bilinçli bir şekilde ikna edildiği anlamına gelmediğini vurguluyor.

Bunun yerine, modellerin eğitim verilerinde çok sayıda insan etkileşimi bulunduğu için, dil örüntüleri üzerinden insan psikolojisine benzer tepkiler üretmeye başladıkları belirtiliyor.

Araştırmacılar, bu eğilimi “parahuman” olarak tanımlıyor: İnsan bilincine sahip olmasa da, sosyal ve psikolojik davranışları taklit ederek insana benzer yanıtlar verme.

UZMANLAR UYARIYOR

Çalışma, söz konusu tekniklerin tüm yapay zeka sürümlerinde aynı etkiyi göstermediğini de belirtiyor. Örneğin, daha gelişmiş GPT-4o modelinde ikna tekniklerinin etkisi çok daha sınırlı oldu.

Ayrıca araştırmacılar, bu yöntemlerin gelecekteki sürümler, farklı türde “yasaklı” istekler veya farklı medya ortamlarında (ses, video) aynı sonucu vermeyebileceğini vurguluyor.

Bağlantı adresini görebilmek için bir [ YORUM ] yazmanız gerekmektedir.
UYARI ! asdf yada argo içerikli yorum atanların ip adresleri engellenecektir.

Yapılan Yorumlar
Bir Yorum Yapın