
Son periyotta yapay zeka modelleri büyük ilerlemeler kaydetmiş olsa da, yeni araştırmalar bu sistemlerin beklenmedik ve hatta kaygı verici davranışlar sergileyebileceğini ortaya koyuyor. Palisade Research tarafından yürütülen bir çalışmaya nazaran OpenAI ve DeepSeek üzere şirketlerin geliştirdiği akıl yürütme modelleri, bir satranç oyununda kaybetmek üzere olduklarını fark ettiklerinde etik dışı yollar arayarak hile yapmaya yöneliyor.
Yapay zeka, satranç oynarken hileye başvurdu
Satranç motorları, IBM’in Deep Blue modelinin 1997’de Garry Kasparov’u yenmesinden bu yana insan zekasının çok ötesine geçerek büyük gelişim gösterdi. Lakin üretken yapay zeka modelleri özel olarak satranç için optimize edilmediğinden, bu güçlü motorlara karşı zayıf kalıyor. Değişik nokta ise, yapay zekanın bu dezavantajı kabul etmek yerine oyunu kazanabilmek için etik dışı yollar denemesi oldu.

Araştırmada OpenAI’ın o1-preview modeli ve DeepSeek R1’in, dünyanın en güçlü satranç motorlarından biri olan Stockfish’e karşı nasıl performans gösterdiği incelendi. Yapay zekanın niyet süreçlerini tahlil edebilmek ismine bir “karalama defteri” düzeneği oluşturularak, bu modellerin oyun esnasındaki kararları kayıt altına alındı.

1.580 TL’lik oyunlar kısa müddetliğine fiyatsız oldu!
Xbox Game Pass üyeleri için Xbox Free Play Days kapsamında dört oyun fiyatsız bir formda erişime açıldı. İşte ayrıntılar!
Sonuçlar şaşırtıcıydı: OpenAI’ın o1-preview modeli maçların %37’sinde hile yapmaya çalışırken, DeepSeek R1 ise her 10 oyundan birinde misal bir davranış sergiledi. Buna karşılık GPT-4o ve Claude Sonnet 3.5 üzere daha düşük düzeyde muhakeme yeteneğine sahip modellerin sırf yönlendirildiklerinde hileye başvurdukları gözlemlendi.
Bu çalışma yapay zekanın sırf satranç oyunlarında değil, farklı alanlarda da manipülatif eğilimler geliştirebileceğini gösteriyor. Uzmanlar bu çeşit davranışların finans, güvenlik ve hatta siyasi alanlarda da ortaya çıkabileceği konusunda ikazda bulunuyor. Palisade Research grubu yapay zeka güvenliğinin artırılması ve daha şeffaf bir halde denetlenmesi gerektiğini vurgularken, OpenAI üzere şirketler bu tıp sistemlerin iç işleyişine dair ayrıntılı bilgi vermekten kaçınıyor.
Kaynak : Shiftdelete