首页 新闻 DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Riley Feb 26,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,这与竞争对手的成本明显更高。但是,这个看似低的数字省略了研究,改进,数据处理和基础设施等大量费用。

DeepSeek的创新方法利用了几种关键技术:多型预测(MTP),以提高准确性和效率;使用256个神经网络加速培训的专家(MOE)的混合物;以及多头潜在注意力(MLA),以增强对关键句子元素的关注。

DeepSeek Test图像:ensigame.com

与他们的公开数字相反,半分析显示,DeepSeek运营着大量的计算基础设施,其中包括多个数据中心的大约50,000个NVIDIA HOPPER GPU,代表了大约16亿美元的服务器投资,运营成本约为9.44亿美元。其中包括10,000 H800、10,000 H100和其他H20 GPU。

DeepSeek V3图像:ensigame.com

中国对冲基金High-Flyer的子公司DeepSeek拥有其数据中心,与云依赖的竞争对手不同,促进了更快的创新和优化。它的自筹资金地位有助于敏捷性和迅速的决策。此外,DeepSeek吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国大学。

DeepSeek图像:ensigame.com

虽然DeepSeek的600万美元培训成本具有误导性,但他们的总投资超过5亿美元。它们的精益结构有助于有效的创新,与更大,更官僚的公司形成鲜明对比。大量投资,技术进步和熟练的团队是他们成功的关键,而不仅仅是“革命预算”。成本差距很明显:DeepSeek的R1型号的成本为500万美元,而Chatgpt4o的培训耗资1亿美元。

DeepSeek图像:ensigame.com

DeepSeek的故事突出了资金庞大的独立人工智能公司有效竞争的潜力,尽管成本异常低的叙述需要仔细审查。

最新文章 更多
  • “尽管有争议,但刺客信条的销售激增”

    刺客的信条阴影在发布后仅15小时内就达到了超过100万玩家,巩固了其作为Steam上最畅销的游戏的地位。更深入地探索游戏的胜利发射和随之而来的一日寂静的补丁。

    May 16,2025
  • 出现跨界:Trello和Discord集成

    * Arise Crossover*现在已经进入了Beta阶段,尽管只有三个地点,但仍有很多兴奋。由于该游戏的官方Trello和Discord频道,在 * Arise Crossover *中的最新进展中保持最新状态非常简单。我们在这里提供

    May 16,2025
  • “头像:领域碰撞 - 更快建造速度和更多胜利的最佳策略”

    从本质上讲,阿凡达:领域碰撞是一个城市建设者,但它是诸如国家奖金,英雄协同效应,世界地图战术和高效的建筑秩序之类的更深层次的层次,可以使您在这场战略游戏中倾向于潮流。如果您已经掌握了基础知识并准备提升游戏玩法,则

    May 16,2025
  • Zenless Zero:1月22日的重要日子

    Zenless Zero零版本1.5:全面的概述日期:Zenless Zero Zero热切期待的1.5版将于1月22日推出,保证有许多令人兴奋的更新和新的内容,以保持玩家的参与和娱乐。NewS-Rank Agents:Astra Yao:Astra Yao:1阶段1阶段,Astra Yao,Astra Yao,Astra Yao。

    May 16,2025
  • 2025年最负担得起的游戏椅

    增强您的游戏设置不必违反银行。游戏椅可能是一项巨大的投资,但是有很多预算友好的选项可提供舒适性和风格,而无需高昂的价格。无论您是受到100美元预算的限制还是寻找可以S的椅子

    May 16,2025
  • “ GTA 6揭幕了70个莱昂达角色和位置的新屏幕截图”

    Rockstar Games通过发布预告片2以及70种令人惊叹的新屏幕截图,对 * Grand Theft Auto VI *的兴奋增强了。这些视觉效果不仅突出了Jason Duval和Lucia Caminos等关键角色

    May 16,2025