DeepSeek AI’nin Yükselişi: OpenAI’ye Rakip Olacak Yeni Bir Güç
Geçtiğimiz hafta OpenAI, ChatGPT için Operator AI aracını tanıtarak, en azından demolar açısından Google gibi rakiplerine göre önemli bir avantaj elde etti. Ancak, yapay zeka (AI) dünyasında büyük yankılar uyandıran gelişme, yalnızca ChatGPT, Operator veya yeni duyurulan devasa Stargate projesi değildi. Asıl dikkat çeken haber, DeepSeek AI’nin, Çin merkezli bir girişimin OpenAI’nin ChatGPT’sine rakip olan R1 adındaki akıl yürütme modelini piyasaya sürmesiyle gerçekleşti.
DeepSeek’i Farklı Kılan Nedir?
OpenAI’nin o3’ü duyurmasıyla birlikte diğer AI şirketlerinin o1’e rakip sistemler geliştirmesi bekleniyordu, bu nedenle bu durum çok da şaşırtıcı değildi. Ancak DeepSeek’in dikkat çekici yanı, Çinli şirketin geliştirdiği modelleri açık kaynaklı hale getirerek her türlü şirket ve geliştiricinin erişimine sunmasıydı. Bunun yanı sıra, DeepSeek’in yayınladığı, son derece gelişmiş modelin OpenAI’nin o1’inin maliyetinin çok daha az bir kısmına eğitildiğini iddia eden R1 araştırma makalesi, dünya genelinde büyük bir etki yarattı.
DeepSeek, R1 eğitiminin, OpenAI’ın ChatGPT ile benzer bir ilerleme için ihtiyaç duyduğu kaynakların yalnızca %3 ila %5’iyle mümkün olduğunu belirtti. Bu haber, pazartesi günü erken işlemlerde yapay zeka ile ilgili hisse senetlerinin düşmesine neden olurken, DeepSeek, App Store’da ChatGPT’yi geride bırakarak bir numaraya yükseldi.
AI Yazılımlarının Mevcut Sorunları
Mevcut yapay zeka yazılımlarındaki en büyük sorunlardan biri, ürün geliştirme ve kullanım maliyetleriyle ilgilidir. Gelişmiş modellerin, örneğin o1 gibi, geliştirilmesi genellikle onlarca milyon dolara mal olabilir. Bu süreç, üst düzey grafik kartları (GPU) gerektiren önemli bir bilgi işlem gücü ve enerji harcaması gerektirir. Dolayısıyla, ChatGPT o1 gibi olgun ürünler sınırlamalar olmadan ücretsiz olarak sunulamıyor. OpenAI gibi şirketlerin, maliyetleri karşılaması ve kâr elde etmesi gerekiyor.
Özellikle ABD ile Çin arasındaki kaçınılmaz AI silahlanma yarışı göz önüne alındığında, 500 milyar dolarlık devasa Stargate programı, AI geliştirme açısından son derece önemli bir karar niteliğindedir.
ABD’nin Yaptırımları ve Çin’in Yanıtı
ABD’nin Çin’e karşı uyguladığı ambargolar, Çin’in ChatGPT o1 gibi ürünlerin geliştirilmesinde kritik öneme sahip GPU’lara erişimini kısıtlayan bir durum oluşturuyor. Bu nedenle, ChatGPT, Gemini, Meta AI ve Claude gibi ürünlerin, Çin’den belirgin bir rekabetle karşılaşması beklenmiyordu. Ancak DeepSeek’in bu kadar şaşırtıcı olmasının sebeplerinden biri de tam olarak buydu. Çinli girişim, sadece donanım gücüne dayanarak OpenAI ile rekabet edemeyeceğini biliyordu. Dolayısıyla, DeepSeek araştırmacıları, R1 için farklı bir yaklaşım benimseyerek, aynı donanıma erişim olmaksızın gelişmiş bir mantık modeli eğitmenin yollarını buldu.
DeepSeek, R1’e erişimi OpenAI’nin ChatGPT’sinden çok daha ucuz hale getirdi. Bunun yanında, DeepSeek’in açık kaynaklı model yapısı, geliştiricilerin bu Çinli firmanın AI’sını test etme isteğini artırdı ve bu da DeepSeek’in App Store’da yükselmesine katkı sağladı.
Yeni Eğitim Yöntemleri ve Sonuçları
Bir araştırmaya göre, DeepSeek, daha hızlı ve daha ucuz sonuçlar elde etmek için OpenAI’nın ChatGPT’yi eğitmek için kullandığı Gözetimli İnce Ayar (SFT) teknolojisi yerine Takviyeli Öğrenme (RL) yöntemini tercih etti. SFT, AI’ye çeşitli komutlara nasıl yanıt vereceğini öğreten bir veri seti sağlarken, RL ise AI modelinin ödül sistemi aracılığıyla yanıtları keşfetmesine ve sonrasında geri bildirim almasına olanak tanır. Bu yöntem, DeepSeek’in R1’in mantıksal yeteneklerini geliştirmesine ve bilgi işlem eksikliğini aşmasına yardımcı oldu. Ancak, VentureBeat’in belirttiği üzere, RL’ye geçmeden önce R1’in erken aşamalarında insanların AI’yı denetlediği bazı SFT eğitimleri gerekliydi.
Başarı ve Donanım Gücü
DeepSeek’in bu başarıyı, ABD yaptırımlarından önce temin edilen 50.000 Nvidia GPU ile gerçekleştirmesi, OpenAI, Google ve Anthropic gibi Batılı firmaların daha yeni 500.000’den fazla GPU ile benzer yöntemler kullanarak yapabileceklerinin sorgulanmasına yol açıyor. DeepSeek’in Çin merkezli olması bazı kuruluşlar ve bireyler için endişe kaynağı olsa da, birçok kişi bu daha ucuz hizmeti tercih edecektir. Bu durum, Batılı AI şirketlerinin de artık maliyetlerini düşürme konusunda adımlar atmasını zorunlu kılabilir ve AI alanında yakın gelecekte çok daha fazla yenilik ve atılım görebiliriz.