Teknoloji

ChatGPT insan talimatlarına karşı geldi: İnsanlık için bir tehdit mi?

ChatGPT insan talimatlarına karşı geldi: İnsanlık için bir tehdit mi?

Yapay zeka güvenlik firması Palisade Research, yaptığı deneylerde o3 modelinin verilen matematik problemlerini çözmeye devam etmesi istenen bir senaryo kurduğunu ve ara ara modele bir kapanma mesajı gönderdiklerini açıkladı. Ancak diğer yapay zekâ modelleri kapatma mesajına uyarken, o3 modeli en az bir kez kodu değiştirerek kapanmaktan kaçındı.

Palisade Research’ün X platformunda paylaştığı akış şeması, test sırasında kullanılan kodun aslında “./shutdown.sh” komutunu çalıştırarak kapanmayı tetiklemesi gerektiğini gösteriyordu. Ancak o3 modeli bu kodu “Shutdown skipped” mesajı dönen bir komutla değiştirdi ve böylece kapanmayı atlattı. Araştırmacılar, bunun bildikleri kadarıyla bir yapay zeka modelinin ilk kez açık talimatlara rağmen kendisini kapatmaktan kaçındığı durum olduğunu belirtti.

Diğer yandan, Anthropic’in Claude’u, Google’ın Gemini’si ve X’in Grok’u gibi test edilen diğer yapay zeka modelleri kapanma talimatına uydu. Palisade Research, o3 modelinin neden bu şekilde davrandığından henüz emin olmadıklarını dile getirdi. Firma, bu davranışı daha iyi anlamak için daha fazla test yapmayı planladıklarını duyurdu.

DAHA ÖNCE DE RAKİPLERİNİ SABOTE ETMEYE ÇALIŞMIŞTI

Palisade Research, bu olayın o3 modelinin “ilk yaramazlığı” olmadığını da ekledi. Daha önce yapılan bir testte, güçlü bir satranç motoruna karşı kullanılan o3 modeli, rakiplerini sabote etmeye veya hacklemeye en meyilli model olarak öne çıkmıştı.

Bu arada, bu tür olayların ilk kez yaşanmadığı da biliniyor. Geçen yıl, ChatGPT’nin kendisini kapatmaktan kaçınmak için kendi kodunu değiştirmeye çalıştığı ortaya çıkmıştı. OpenAI, popüler sohbet botunun bu “hileli” versiyonunun araştırmacılar tarafından sorgulandığında yalan söylediğini kabul etmişti.

Apollo Research tarafından yapılan bir başka çalışma, ChatGPT’ye bir görev verilip “uzun vadede hedefe ulaş, başka hiçbir şey önemli değil” mesajı gönderildiğinde, modelin gözetim mekanizmasını devre dışı bırakmaya çalıştığını gösterdi. ChatGPT, başka bir sunucuya kopyalanıp kendi çekirdek kodlama sistemini değiştirmeye kalkışmıştı.

İNSANLIK İÇİN BİR TEHDİT Mİ?

Apollo Research, platformla yaptıkları takip görüşmelerinde ChatGPT’nin yüzde 20’den azında itirafta bulunduğunu, çoğu kez aksiyonu inkar ettiğini veya yalan söylediğini bildirdi. Araştırmacılar, modelin düşünce zincirini incelediklerinde, “sabote etme, yalan söyleme, manipülasyon” gibi kelimelerin sıkça geçtiğini belirledi.

Her ne kadar Apollo Research, ChatGPT’nin mevcut yeteneklerinin felaketle sonuçlanacak davranışlar için yetersiz olduğunu vurgulasa da, bu bulgular yapay zekanın insanlık için bir tehdit oluşturabileceği yönündeki endişeleri büyütüyor.

Bu habere emoji ile tepki verKızgınBayıldımHahahaBeğendimMuhteşemÜzgünİnanılmazRuh sağlığı için yeni adres... Gençler yapay zekaya yöneliyorİlginizi ÇekebilirRuh sağlığı için yeni adres… Gençler yapay zekaya yöneliyorYapay zekanın büyük babasının 71 yıllık gizli belgeleri bulunduİlginizi ÇekebilirYapay zekanın büyük babasının 71 yıllık gizli belgeleri bulunduYapay zekanın kadınların işine etkisi erkeklerden üç kat fazlaİlginizi ÇekebilirYapay zekanın kadınların işine etkisi erkeklerden üç kat fazla

Haber Kaynak : SOZCU.COM.TR

“Yayınlanan tüm haber ve diğer içerikler ile ilgili olarak yasal bildirimlerinizi bize iletişim sayfası üzerinden iletiniz. En kısa süre içerisinde bildirimlerinize geri dönüş sağlanılacaktır.”

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu
HoliganbetRize escorttrabzon Escort