Çin’den çıkara tüm dünyayı tesirine alan ve ChatGPT’nin en büyük rakibi olarak gösterilen DeepSeek, yeni haberlere bakılacak olursa zati güzel olan güç tüketimini çok daha ileri bir noktaya taşıyabilir. Gelen raporlara nazaran yapay zeka uygulamasının güncellenmiş R1 AI modeli, tek bir GPU üzerinden çalışabilecek düzeye geldi. Yeni R1 modelinin daha küçük, bir versiyonu olan DeepSeek-R1-0528-Qwen3-8B’nin piyasaya sürülmesiyle birlikte DeepSeek, bu modelin makul benchmark testlerinde emsal boyutlardaki modelleri geride bıraktığını argüman ediyor.
Alibaba’nın Mayıs ayında piyasaya sürdüğü Qwen3-8B modelini temel alarak geliştirilen, daha küçük ve güncellenmiş R1 versiyonu, kuvvetli matematik sorularından oluşan AIME 2025 testinde Google’ın Gemini 2.5 Flash modeline nazaran çok daha âlâ performans göstermiş.
DeepSeek-R1-0528-Qwen3-8B, Microsoft’un kısa müddet evvel piyasaya sürdüğü Phi 4 modeliyle diğer bir matematik marifet testi olan HMMT’de ise neredeyse birebir performansı yakalamış.
DeepSeek-R1-0528-Qwen3-8B üzere kelamda ufaltılmış modeller, ekseriyetle tam boyutlu muadillerinden daha az yetenekli olsa da performansıyla öne çıkabiliyor. Tabi bu versiyonların en değerli artısı ise, hesaplama açısından çok daha az kaynak gerektiriyor olmaları.
Bulut platformu NodeShift’e nazaran, Qwen3-8B’nin çalışması için 40 GB – 80 GB RAM’e sahip bir GPU (örneğin, bir Nvidia H100) gerekiyor. Tam boyutlu yeni R1 ile kıyaslama yaptığımızda ise bu modelin yaklaşık bir düzine 80 GB GPU gerektirdiğini görüyoruz.
DeepSeek-R1-0528-Qwen3-8B, müsaade veren bir MIT lisansı altında sunuluyor, yani ticari olarak kısıtlama olmaksızın kullanılabilir. LM Studio da dahil olmak üzere birçok dağıtıcı, bu modeli bir API aracılığıyla sunuyor.

