Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. Çinli girişim, güçlü Deepseek V3 sinir ağını sadece 6 milyon dolar için eğittiğini iddia ediyor ve sadece 2048 GPU kullanıyor, bu da rakiplerin önemli ölçüde daha yüksek maliyetleriyle tam bir tezat oluşturuyor. Ancak bu görünüşte düşük rakam, araştırma, iyileştirme, veri işleme ve altyapı gibi önemli masrafları atlar.
Deepseek'in yenilikçi yaklaşımı birkaç temel teknolojiyi kullanır: iyileştirilmiş doğruluk ve verimlilik için çoklu atılmış tahmin (MTP); Hızlandırılmış eğitim için 256 sinir ağı kullanan uzmanların (MOE) karışımı; ve önemli cümle unsurlarına daha fazla odaklanmak için çok başlı gizli dikkat (MLA).
%İmgp%resim: ensigame.com
Yayınlanan rakamlarının aksine, Semianalysis, Deepseek'in, kabaca 1,6 milyar dolarlık toplam sunucu yatırımını ve 944 milyon $ 'a yakın operasyonel maliyetleri temsil eden, birden fazla veri merkezinde yaklaşık 50.000 NVIDIA Hopper GPU'larını kapsayan büyük bir hesaplama altyapısı işlettiğini ortaya koyuyor. Buna 10.000 H800, 10.000 H100 ve ek H20 GPU'lar dahildir.
%İmgp%resim: ensigame.com
Bir Çin Hedge Fonu olan High-Flyer'in bir yan kuruluşu olan Deepseek, buluta güvenen rakiplerin aksine, daha hızlı yenilik ve optimizasyonu teşvik eden veri merkezlerinin sahibidir. Kendi kendini finanse eden statüsü çevikliğe ve hızlı karar vermeye katkıda bulunur. Dahası, Deepseek en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde, öncelikle Çin üniversitelerinden kazanıyor.
%İmgp%resim: ensigame.com
Deepseek'in 6 milyon dolarlık eğitim maliyeti yanıltıcı olsa da, genel yatırımları 500 milyon doları aşıyor. Yalın yapıları, daha büyük, daha bürokratik şirketlerle zıt olan verimli yeniliği kolaylaştırıyor. Önemli yatırım, teknolojik gelişmeler ve yetenekli ekip, sadece "devrimci bir bütçe" değil, başarılarının anahtarıdır. Maliyet eşitsizliği belirgindir: Deepseek'in R1 modeli 5 milyon dolara mal olurken, ChatGpt4o'nun eğitiminin maliyeti 100 milyon dolara mal oluyor.
%İmgp%resim: ensigame.com
Deepseek'in hikayesi, iyi finanse edilen, bağımsız AI şirketlerinin etkili bir şekilde rekabet etme potansiyelini vurgulamaktadır, ancak olağanüstü düşük maliyetlerin anlatısı dikkatli bir inceleme gerektirir.