Deepseeks überraschend kostengünstige KI -Modell stellt die Branchenriesen heraus. Das chinesische Startup behauptet, sein mächtiges Neuralnetz von Deepseek V3 für nur 6 Millionen US -Dollar ausgebildet zu haben, wobei nur 2048 GPUs ein starker Kontrast zu den deutlich höheren Kosten der Wettbewerber verwendet wurden. Diese scheinbar niedrige Zahl lässt jedoch erhebliche Ausgaben wie Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur aus.
Der innovative Ansatz von Deepseek nutzt mehrere Schlüsseltechnologien: Multi-Tooken-Vorhersage (MTP) für eine verbesserte Genauigkeit und Effizienz; Mischung aus Experten (MOE), die 256 neuronale Netzwerke für eine beschleunigte Schulung einsetzen; und mehrköpfige latente Aufmerksamkeit (MLA) für einen verbesserten Fokus auf wichtige Satzelemente.
Bild: Ensigame.com
Im Gegensatz zu ihren publizierten Zahlen zeigt die semianalyse, dass Deepseek eine massive Computerinfrastruktur betreibt, die ungefähr 50.000 NVIDIA Hopper -GPUs in mehreren Rechenzentren umfasst und eine Gesamtinvestition von rund 1,6 Milliarden US -Dollar und Betriebskosten nahe 944 Millionen US -Dollar entspricht. Dies umfasst 10.000 H800, 10.000 H100 und zusätzliche H20 -GPUs.
Bild: Ensigame.com
Deepseek, eine Tochtergesellschaft von High-Flyer, einem chinesischen Hedgefonds, besitzt im Gegensatz zu Cloud-abhängigen Wettbewerbern ihre Rechenzentren, die eine schnellere Innovation und Optimierung fördert. Sein selbstfinanzierter Status trägt zur Agilität und zur schnellen Entscheidungsfindung bei. Darüber hinaus zieht Deepseek Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von chinesischen Universitäten.
Bild: Ensigame.com
Während die Schulungskosten von Deepseek 6 Millionen US -Dollar irreführend sind, liegt ihre Gesamtinvestition über 500 Millionen US -Dollar. Ihre magere Struktur erleichtert effiziente Innovationen, die zu größeren, bürokratischeren Unternehmen kontrastieren. Die erheblichen Investitionen, technologischen Fortschritte und das qualifizierte Team sind der Schlüssel zu ihrem Erfolg, nicht nur zu einem "revolutionären Budget". Die Kostenunterschiede sind offensichtlich: Das R1 -Modell von Deepseek kostet 5 Millionen US -Dollar, während Chatgpt4O Training 100 Millionen US -Dollar kostete.
Bild: Ensigame.com
Die Geschichte von Deepseek unterstreicht das Potenzial gut finanzierter, unabhängiger KI-Unternehmen, effektiv zu konkurrieren, obwohl die Erzählung von außergewöhnlich niedrigen Kosten eine sorgfältige Prüfung erfordert.