Yapay Zeka Dünyasındaki Son Gelişmeler
Son zamanlarda yapay zeka (AI) alanında o kadar çok yenilik ve atılım yaşanıyor ki, bu gelişmeleri takip etmenin neredeyse imkansız olduğu söylenebilir; en azından geleneksel yöntemlerle. Ancak bu atılımlar arasında, DeepSeek’in R1 modeli, OpenAI’nin GPT-4’ü kadar güçlü olmasına rağmen çok daha düşük bir maliyetle geliştirilmesiyle dikkat çekmeyi başardı. DeepSeek, bu etkileyici modeli geliştirmek için yalnızca 5,6 milyon dolar harcadığını iddia ediyor; bu rakam, OpenAI’nin GPT-4’ü eğitmek için harcadığı 100 milyon dolar ile kıyaslandığında oldukça düşük kalıyor.
DeepSeek, yapay zeka sektöründe adeta bir devrim yarattı. Ancak, bu konuyla ilgili olarak Paris’te düzenlenen Yapay Zeka Eylem Zirvesi’nde Bloomberg’e konuşan Google DeepMind CEO’su ve kurucu ortağı Demis Hassabis, DeepSeek tarafından yapılan cesur iddialara dair yorumlarda bulundu. Hassabis, “Gerçekten etkileyici bir model, son derece başarılı bir çalışma ve bence bu ekip, Çin’den çıkan en iyi ekiplerden biri” dedi. Ancak, iddiaların çoğunun abartılı ve yanıltıcı olduğunu düşündüğünü de ekledi.
Hassabis, DeepSeek geliştiricilerinin paylaştığı ve medyada geniş yer bulan düşük maliyetin yalnızca “son eğitim çalışmasının” maliyetine işaret ettiğini belirtti. Bu durumun, bir yapay zeka modelinin baştan sona eğitilmesi için gereken toplam maliyetin yalnızca küçük bir kısmını oluşturduğunu vurguladı. Ayrıca, DeepSeek’in “geliştirmek için Batı modellerine güvendiği” yönündeki iddialarını da dile getirdi. OpenAI, DeepSeek’in lansmanından sonraki günlerde benzer bir görüş bildirmişti; “Çin Halk Cumhuriyeti merkezli şirketlerin ve diğerlerinin, önde gelen ABD yapay zeka şirketlerinin modellerini sürekli olarak dönüştürmeye çalıştığını biliyoruz” şeklinde bir açıklama yapmıştı.
Son olarak, Hassabis, DeepSeek ne kadar etkileyici olsa da, Google’ın bu modeli yeni teknolojiler veya teknikler açısından “fantastik bir çözüm” olarak görmediğini belirtti. Hassabis, “Bunun etkileyici olduğunu kabul ediyorum, ancak verimlilik eğrisinde yeni bir aşırı değer değil. Örneğin, Gemini, eğitimden performansa veya maliyetten performansa göre DeepSeek’ten daha verimli bir model” diyerek ekledi: “Sadece bu konu hakkında fazla konuşmuyoruz.”