Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. La startup cinese afferma di aver formato la sua potente rete neurale di DeepSeek V3 per soli 6 milioni di dollari, utilizzando solo 2048 GPU, un netto contrasto con i costi significativamente più elevati dei concorrenti. Questa cifra apparentemente bassa, tuttavia, omette spese sostanziali come ricerca, raffinatezza, elaborazione dei dati e infrastruttura.
L'approccio innovativo di DeepSeek sfrutta diverse tecnologie chiave: previsione multi-token (MTP) per una migliore precisione ed efficienza; Miscela di esperti (MOE) che impiegano 256 reti neurali per una formazione accelerata; e attenzione latente a più testa (MLA) per una maggiore attenzione agli elementi di frase cruciale.
Immagine: Ensigame.com
Contrariamente alle loro cifre pubblicizzate, la seminalisi rivela che DeepSeek gestisce una massiccia infrastruttura computazionale, che comprende circa 50.000 GPU di Nvidia Hopper su più data center, che rappresenta un investimento totale di server di circa 1,6 miliardi di dollari e costi operativi vicino a $ 944 milioni. Ciò include 10.000 H800, 10.000 H100 e GPU H20 aggiuntive.
Immagine: Ensigame.com
DeepSeek, una consociata di High-Flyer, un hedge fund cinese, possiede i suoi data center, a differenza dei concorrenti relativi al cloud, promuovendo innovazione e ottimizzazione più veloci. Il suo stato autofinanziato contribuisce all'agilità e al rapido processo decisionale. Inoltre, DeepSeek attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle università cinesi.
Immagine: Ensigame.com
Mentre il costo di formazione di $ 6 milioni di Deepseek è fuorviante, il loro investimento complessivo supera i $ 500 milioni. La loro struttura snella facilita l'innovazione efficiente, in contrasto con aziende più grandi e burocratiche. Gli investimenti sostanziali, i progressi tecnologici e il team qualificato sono fondamentali per il loro successo, non solo un "budget rivoluzionario". La disparità dei costi è evidente: il modello R1 di DeepSeek costa $ 5 milioni, mentre la formazione di Chatgpt4o costa $ 100 milioni.
Immagine: Ensigame.com
La storia di Deepseek evidenzia il potenziale di società di intelligenza artificiale ben finanziate e indipendenti di competere in modo efficace, sebbene la narrazione di costi eccezionalmente bassi richieda un attento esame.