DeepSeek AI’nin Yükselişi ve OpenAI Rekabeti
Geçtiğimiz hafta, OpenAI’nin ChatGPT için Operator AI aracını tanıtması, en azından demo aşamasında Google gibi rakiplerine karşı büyük bir üstünlük sağladığını gösterdi. Ancak, yapay zeka dünyasında gerçek bir sarsıntıya neden olan haber, ChatGPT, Operator ya da geçen hafta duyurulan devasa Stargate projesi değildi. Bu dalgayı yaratan, Çinli bir girişimin OpenAI’nin ChatGPT o1’ine rakip olarak geliştirdiği R1 akıl yürütme modeli oldu.
DeepSeek’i Farklı Kılan Unsurlar
OpenAI o3’ü duyururken, diğer yapay zeka firmalarının o1’e rakip sistemler geliştirmesi beklenen bir durumdu; ancak DeepSeek’in dikkat çekici yanı, Çin merkezli şirketin modellerini açık kaynaklı hale getirerek herkesin erişimine ve incelemesine sunmasıydı. Bunun yanı sıra, DeepSeek’in yayınladığı ve OpenAI’nin o1’ine kıyasla çok daha düşük maliyetle eğitildiğini iddia ettiği R1 araştırma makalesi, dünya genelinde geniş yankı uyandırdı. DeepSeek, R1 eğitiminin OpenAI’nın ChatGPT ile benzer bir ilerleme için ihtiyaç duyduğu kaynakların yalnızca %3 ila %5’iyle mümkün olduğunu belirtti. Bu haber, pazartesi günü yapay zeka ile ilgili hisse senetlerinde düşüşe yol açarken, DeepSeek, App Store’da ChatGPT’yi geride bırakarak 1 numaraya yükseldi.
Mevcut yapay zeka yazılımlarındaki en büyük sorunlardan biri, ürün geliştirme ve kullanım maliyetleri ile ilgilidir. o1 gibi gelişmiş modellerin geliştirilmesi, genellikle onlarca milyon dolara mal olmaktadır. Bunun sebebi, gerekli bilgi işlem gücünü ve enerji tüketimini sağlayan üst düzey grafik kartları (GPU) gereksinimidir. Bu nedenle, ChatGPT o1 gibi bitmiş ürünler sınırlamalar olmadan ücretsiz olarak sunulamamaktadır. OpenAI gibi şirketlerin maliyetleri karşılaması ve kâr elde etmesi gerekmektedir. Bu bağlamda, 500 milyar dolarlık devasa Stargate programı, özellikle ABD ile Çin arasındaki kaçınılmaz yapay zeka silahlanma yarışı düşünüldüğünde, yapay zeka geliştirme açısından kritik bir karar niteliğindedir.
ABD’nin Çin’e Uyguladığı Ambargo ve Sonuçları
ABD’nin Çin’e uyguladığı ambargolar göz önüne alındığında, Çin’in ChatGPT o1 ürünlerinin geliştirilmesini mümkün kılan üst düzey çiplere ve GPU’lara erişiminin engellenmesi beklenebilirdi. Bu nedenle, ChatGPT, Gemini, Meta AI ve Claude’un Çin’den önemli bir rekabetle karşılaşması pek olası görünmüyordu. Ancak DeepSeek’in bu kadar dikkat çekici olmasının ardında yatan sebeplerden biri de buydu. Çinli girişim, yalnızca donanım gücüne dayanarak OpenAI ile rekabet edemeyeceğini biliyordu; dolayısıyla, DeepSeek araştırmacıları, R1 için farklı bir yaklaşım benimseyerek gelişmiş bir mantık modeli eğitmenin yollarını keşfettiler.
DeepSeek, R1 modelinin erişimini OpenAI’nin ChatGPT’sinden çok daha uygun maliyetli hale getirdi. Ayrıca, DeepSeek’in açık kaynaklı doğası, neden geliştiricilerin bu Çinli firmanın yapay zekasını test etmek için akın ettiğini ve DeepSeek’in App Store’da neden hızla yükseldiğini anlamayı kolaylaştırıyor.
Bir araştırmaya göre, DeepSeek, daha hızlı ve daha düşük maliyetle sonuçlar elde etmek için OpenAI’nin ChatGPT’yi eğitmek için kullandığı Gözetimli İnce Ayar (SFT) teknolojisi yerine Takviyeli Öğrenme (RL) yöntemini tercih etti. SFT, yapay zekaya çeşitli komutlara nasıl yanıt vereceğini öğretirken, RL, modelin karar verme sürecini ödül sistemi ile yönlendirerek daha etkili sonuçlar elde etmesine olanak tanır. Bu yöntem, DeepSeek’in R1’in mantık yeteneklerini geliştirip hesaplama eksikliğini aşmasına yardımcı oldu. Ancak, VentureBeat’in belirttiğine göre, RL’ye geçmeden önce R1’in erken aşamalarında insan denetimi ile bazı SFT eğitimlerinin yapılması gerekiyordu.
Sadece 50.000 Nvidia GPU ile Gelen Başarı
DeepSeek’in bu başarıyı, ABD yaptırımları öncesinde edinilen 50.000 Nvidia GPU ile başarmış olması, çok daha yeni ve 500.000’den fazla GPU ile çalışan OpenAI, Google ve Anthropic gibi Batılı firmaların benzer yöntemler kullanarak yapabileceklerinin sorgulanmasına yol açmaktadır. Çin’de High-Flyer Capital Management fonunun desteklediği DeepSeek-R1 modelinin, yalnızca 2 bin Nvidia çipi kullanılarak ve yaklaşık 5,6 milyon dolar maliyetle geliştirildiği belirtiliyor. Bu durum, DeepSeek’in Çin merkezli olmasının bazı kuruluşlar ve kişiler için bir endişe kaynağı olabileceği gerçeğini göz önünde bulundururken, birçok kişinin daha uygun fiyatlı bu hizmeti tercih edeceğini de unutmamak gerekiyor. Sonuç olarak, Batılı yapay zeka şirketlerinin artık maliyetlerini azaltmak zorunda kalabileceği ve yapay zeka alanında çok daha fazla yenilik görebileceğimiz bir dönem kapıda olabilir.