
Stanford Üniversitesi ve Washington Üniversitesi’nden araştırmacılar, sırf 26 dakika içinde ve 50 dolardan daha az bir maliyetle OpenAI’ın gelişmiş modellerine rakip bir yapay zeka modelini eğitmeyi başardı. s1 olarak isimlendirilen bu model, 1.000 sorudan oluşan küçük bir data seti ile eğitildi ve büyük yapay zeka modellerinin bilgisini küçük modellere aktaran distilasyon (distillation) tekniği ile geliştirildi.
50 dolarlık OpenAI rakibi yapay zeka: s1
Araştırmacılar, s1’in mantık yürütme yeteneklerini geliştirmek için Google’ın Gemini 2.0 Flash Thinking Experimental modelinden yararlandı. Lakin Google’ın hizmet kaideleri Gemini API’sinin rakip yapay zeka modellerinin geliştirilmesi için kullanılmasını yasaklıyor ve bu durum mümkün tüzel sıkıntıları gündeme getiriyor.

s1 modeli, Alibaba Cloud’un açık kaynaklı Qwen2.5 modeli üzerine inşa edildi. Başlangıçta 59.000 soruluk büyük bir bilgi seti kullanılarak eğitime başlansa da yapılan testler daha küçük bir data setinin benzeri doğruluk oranlarını sunduğunu ortaya koydu ve böylelikle eğitim mühleti ve maliyet değerli ölçüde düşürüldü.

Çin, Trump vergileri yüzünden Apple’a acımayacak!
Çin, Apple’ın App Store siyasetlerini inceliyor. ABD-Çin ticaret gerginliği tırmanırken şirketlerde son durum ne?
Eğitim süreci 16 adet Nvidia H100 GPU kullanılarak tamamlandı. Model, doğruluğunu artırmak için test-time scaling ismi verilen gelişmiş bir teknikten yararlanıyor. Araştırmacılar, modele “Wait” komutu ekleyerek karşılık üretme mühletini uzattı ve böylelikle modelin cevaplarını tekrar gözden geçirip yanlışlarını düzeltmesine imkan tanıdı. Bu prosedür, yapay zekanın karmaşık mantık süreçlerini daha hakikat çalıştırmasını sağladı.
Bu gelişme, yüksek performanslı yapay zeka modellerinin kesinlikle milyarlarca dolarlık yatırımlarla ve devasa data merkezleriyle eğitilmesi gerekmediğini kanıtlıyor. OpenAI’ın o1 modeli de misal bir mantık yürütme tekniği kullanıyor ve Çin merkezli DeepSeek’in R1 modeli, benzeri bir teknikle çok daha düşük maliyetle geliştirildiğini tez ediyor.
Ancak OpenAI, DeepSeek’i modellerinden bilgi distile ederek rakip bir yapay zeka geliştirmekle suçladı ve bu durum büyük teknoloji şirketlerinin açık kaynak yapay zeka modelleri karşısındaki duruşlarını tekrar gözden geçirmelerine neden olabilir.
Kaynak : Shiftdelete