Deepseek est étonnamment bon marché, le modèle d'IA défie les géants de l'industrie. La startup chinoise prétend avoir formé son puissant réseau de neurones Deepseek V3 pour seulement 6 millions de dollars, utilisant seulement 2048 GPU, un contraste frappant avec les coûts nettement plus élevés des concurrents. Ce chiffre apparemment bas, cependant, omet des dépenses substantielles comme la recherche, le raffinement, le traitement des données et les infrastructures.
L'approche innovante de Deepseek exploite plusieurs technologies clés: prédiction multi-token (MTP) pour une meilleure précision et efficacité; Mélange d'experts (MOE) employant 256 réseaux de neurones pour une formation accélérée; et l'attention latente multi-tête (MLA) pour une concentration améliorée sur les éléments de phrase cruciaux.
Image: esigame.com
Contrairement à leurs chiffres médicaux, la semianalyse révèle que Deepseek exploite une infrastructure de calcul massive, englobant environ 50 000 GPU Nvidia Hopper dans plusieurs centres de données, représentant un investissement total de serveur d'environ 1,6 milliard de dollars et les coûts opérationnels près de 944 millions de dollars. Cela comprend 10 000 H800, 10 000 H100 et des GPU H20 supplémentaires.
Image: esigame.com
Deepseek, une filiale de High-Flyer, un fonds spéculatif chinois, possède ses centres de données, contrairement à des concurrents californiens, favorisant l'innovation et l'optimisation plus rapides. Son statut autofinancé contribue à l'agilité et à la prise de décision rapide. En outre, Deepseek attire les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, principalement des universités chinoises.
Image: esigame.com
Alors que le coût de formation de 6 millions de dollars de Deepseek est trompeur, leur investissement global dépasse 500 millions de dollars. Leur structure maigre facilite une innovation efficace, contrastant avec des entreprises plus grandes et plus bureaucratiques. L'investissement substantiel, les progrès technologiques et l'équipe qualifiée sont essentiels à leur succès, pas uniquement un «budget révolutionnaire». La disparité des coûts est évidente: le modèle R1 de Deepseek a coûté 5 millions de dollars, tandis que la formation de Chatppt4o coûte 100 millions de dollars.
Image: esigame.com
L'histoire de Deepseek met en évidence le potentiel de sociétés d'IA indépendantes bien financées pour rivaliser efficacement, bien que le récit de coûts exceptionnellement bas nécessite un examen minutieux.