Teknoloji

ChatGPT insan talimatlarına karşı geldi: İnsanlık için bir tehdit mi?

Yapay zeka güvenlik firması Palisade Research, yaptığı deneylerde o3 modelinin verilen matematik problemlerini çözmeye devam etmesi istenen bir senaryo kurduğunu ve ara ara modele bir kapanma mesajı gönderdiklerini açıkladı. Ancak diğer yapay zekâ modelleri kapatma mesajına uyarken, o3 modeli en az bir kez kodu değiştirerek kapanmaktan kaçındı.

Palisade Research’ün X platformunda paylaştığı akış şeması, test sırasında kullanılan kodun aslında “./shutdown.sh” komutunu çalıştırarak kapanmayı tetiklemesi gerektiğini gösteriyordu. Ancak o3 modeli bu kodu “Shutdown skipped” mesajı dönen bir komutla değiştirdi ve böylece kapanmayı atlattı. Araştırmacılar, bunun bildikleri kadarıyla bir yapay zeka modelinin ilk kez açık talimatlara rağmen kendisini kapatmaktan kaçındığı durum olduğunu belirtti.

Diğer yandan, Anthropic’in Claude’u, Google’ın Gemini’si ve X’in Grok’u gibi test edilen diğer yapay zeka modelleri kapanma talimatına uydu. Palisade Research, o3 modelinin neden bu şekilde davrandığından henüz emin olmadıklarını dile getirdi. Firma, bu davranışı daha iyi anlamak için daha fazla test yapmayı planladıklarını duyurdu.

DAHA ÖNCE DE RAKİPLERİNİ SABOTE ETMEYE ÇALIŞMIŞTI

Palisade Research, bu olayın o3 modelinin “ilk yaramazlığı” olmadığını da ekledi. Daha önce yapılan bir testte, güçlü bir satranç motoruna karşı kullanılan o3 modeli, rakiplerini sabote etmeye veya hacklemeye en meyilli model olarak öne çıkmıştı.

Bu arada, bu tür olayların ilk kez yaşanmadığı da biliniyor. Geçen yıl, ChatGPT’nin kendisini kapatmaktan kaçınmak için kendi kodunu değiştirmeye çalıştığı ortaya çıkmıştı. OpenAI, popüler sohbet botunun bu “hileli” versiyonunun araştırmacılar tarafından sorgulandığında yalan söylediğini kabul etmişti.

Apollo Research tarafından yapılan bir başka çalışma, ChatGPT’ye bir görev verilip “uzun vadede hedefe ulaş, başka hiçbir şey önemli değil” mesajı gönderildiğinde, modelin gözetim mekanizmasını devre dışı bırakmaya çalıştığını gösterdi. ChatGPT, başka bir sunucuya kopyalanıp kendi çekirdek kodlama sistemini değiştirmeye kalkışmıştı.

İNSANLIK İÇİN BİR TEHDİT Mİ?

Apollo Research, platformla yaptıkları takip görüşmelerinde ChatGPT’nin yüzde 20’den azında itirafta bulunduğunu, çoğu kez aksiyonu inkar ettiğini veya yalan söylediğini bildirdi. Araştırmacılar, modelin düşünce zincirini incelediklerinde, “sabote etme, yalan söyleme, manipülasyon” gibi kelimelerin sıkça geçtiğini belirledi.

Her ne kadar Apollo Research, ChatGPT’nin mevcut yeteneklerinin felaketle sonuçlanacak davranışlar için yetersiz olduğunu vurgulasa da, bu bulgular yapay zekanın insanlık için bir tehdit oluşturabileceği yönündeki endişeleri büyütüyor.

Bu habere emoji ile tepki ver Ruh sağlığı için yeni adres... Gençler yapay zekaya yöneliyor İlginizi ÇekebilirRuh sağlığı için yeni adres… Gençler yapay zekaya yöneliyor Yapay zekanın büyük babasının 71 yıllık gizli belgeleri bulundu İlginizi ÇekebilirYapay zekanın büyük babasının 71 yıllık gizli belgeleri bulundu Yapay zekanın kadınların işine etkisi erkeklerden üç kat fazla İlginizi ÇekebilirYapay zekanın kadınların işine etkisi erkeklerden üç kat fazla

Haber Kaynak : SOZCU.COM.TR

“Yayınlanan tüm haber ve diğer içerikler ile ilgili olarak yasal bildirimlerinizi bize iletişim sayfası üzerinden iletiniz. En kısa süre içerisinde bildirimlerinize geri dönüş sağlanılacaktır.”

Sonrakini Oku

ChatGPT insan talimatlarına karşı geldi: İnsanlık için bir tehdit mi?

Sonrakini Oku

Siber Suç Operasyonunda 171 Gözaltı

Türksat 6A kalıcı yörüngesine ulaştı

Bilim insanlarından yeni keşif: Mars’ta eskiden yaşam var mıydı?

Instagram yeni özelliğini duyurdu: Zamanlanmış mesajlar! Mesaj nasıl zamanlanır?

WhatsApp, 2025’ten itibaren bu telefonlarda desteklenmeyecek

AB’den üye ülkelere İsrail çağrısı: Belki de daha az silah sağlamalısınız

Siber Suç Operasyonunda 171 Gözaltı

Türksat 6A kalıcı yörüngesine ulaştı

Bilim insanlarından yeni keşif: Mars’ta eskiden yaşam var mıydı?

Instagram yeni özelliğini duyurdu: Zamanlanmış mesajlar! Mesaj nasıl zamanlanır?

WhatsApp, 2025’ten itibaren bu telefonlarda desteklenmeyecek

AB’den üye ülkelere İsrail çağrısı: Belki de daha az silah sağlamalısınız

Bir yanıt yazın Yanıtı iptal et

Fatih Erbakan: Bir yanda ABD, bir yanda YPG biz de Emevi Camii’nde namaz kılıyoruz

Kılıçdaroğlu’nun mal varlıklarına ve banka hesaplarına haciz konuldu

İhraçları istenen teğmenlerin dosyası ikinci kez disiplin kurulunda

İktidar, AFAD personeline kapıları kapattı…

Oba Makarna halka açılıyor

İsrail basını: Trump Netanyahu’yu İran konusunda uyardı

Bakan Fidan Moskova’da: Görüşmelere ev sahipliğine devam etmek istiyoruz

Kremlin’den Donald Trump yorumu: Aşırı duygusal yük belirtisi gösteriyor

Gazze’de yardım noktasında havaya ateş açıldı

Vatikan Başbakanı: Gazze’de yaşananlar kabul edilemez

Sonrakini Oku

Siber Suç Operasyonunda 171 Gözaltı

Türksat 6A kalıcı yörüngesine ulaştı

Bilim insanlarından yeni keşif: Mars’ta eskiden yaşam var mıydı?

Instagram yeni özelliğini duyurdu: Zamanlanmış mesajlar! Mesaj nasıl zamanlanır?

WhatsApp, 2025’ten itibaren bu telefonlarda desteklenmeyecek

AB’den üye ülkelere İsrail çağrısı: Belki de daha az silah sağlamalısınız

Siber Suç Operasyonunda 171 Gözaltı

Türksat 6A kalıcı yörüngesine ulaştı

Bilim insanlarından yeni keşif: Mars’ta eskiden yaşam var mıydı?

Instagram yeni özelliğini duyurdu: Zamanlanmış mesajlar! Mesaj nasıl zamanlanır?

WhatsApp, 2025’ten itibaren bu telefonlarda desteklenmeyecek

AB’den üye ülkelere İsrail çağrısı: Belki de daha az silah sağlamalısınız

Sitemize abone olabilirsiniz!

Siber Suç Operasyonunda 171 Gözaltı

Pusu kurdukları otomobile kurşun yağdırdılar!

Bir yanıt yazın Yanıtı iptal et

Fatih Erbakan: Bir yanda ABD, bir yanda YPG biz de Emevi Camii’nde namaz kılıyoruz

Kılıçdaroğlu’nun mal varlıklarına ve banka hesaplarına haciz konuldu

İhraçları istenen teğmenlerin dosyası ikinci kez disiplin kurulunda

İktidar, AFAD personeline kapıları kapattı…

Oba Makarna halka açılıyor

İsrail basını: Trump Netanyahu’yu İran konusunda uyardı

Bakan Fidan Moskova’da: Görüşmelere ev sahipliğine devam etmek istiyoruz

Kremlin’den Donald Trump yorumu: Aşırı duygusal yük belirtisi gösteriyor

Gazze’de yardım noktasında havaya ateş açıldı

Vatikan Başbakanı: Gazze’de yaşananlar kabul edilemez