首页 新闻 DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Riley Feb 26,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,这与竞争对手的成本明显更高。但是,这个看似低的数字省略了研究,改进,数据处理和基础设施等大量费用。

DeepSeek的创新方法利用了几种关键技术:多型预测(MTP),以提高准确性和效率;使用256个神经网络加速培训的专家(MOE)的混合物;以及多头潜在注意力(MLA),以增强对关键句子元素的关注。

DeepSeek Test图像:ensigame.com

与他们的公开数字相反,半分析显示,DeepSeek运营着大量的计算基础设施,其中包括多个数据中心的大约50,000个NVIDIA HOPPER GPU,代表了大约16亿美元的服务器投资,运营成本约为9.44亿美元。其中包括10,000 H800、10,000 H100和其他H20 GPU。

DeepSeek V3图像:ensigame.com

中国对冲基金High-Flyer的子公司DeepSeek拥有其数据中心,与云依赖的竞争对手不同,促进了更快的创新和优化。它的自筹资金地位有助于敏捷性和迅速的决策。此外,DeepSeek吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国大学。

DeepSeek图像:ensigame.com

虽然DeepSeek的600万美元培训成本具有误导性,但他们的总投资超过5亿美元。它们的精益结构有助于有效的创新,与更大,更官僚的公司形成鲜明对比。大量投资,技术进步和熟练的团队是他们成功的关键,而不仅仅是“革命预算”。成本差距很明显:DeepSeek的R1型号的成本为500万美元,而Chatgpt4o的培训耗资1亿美元。

DeepSeek图像:ensigame.com

DeepSeek的故事突出了资金庞大的独立人工智能公司有效竞争的潜力,尽管成本异常低的叙述需要仔细审查。

最新文章 更多
  • 有史以来25本最畅销的书

    本文撰写了有史以来25本最畅销的文学小说书籍的列表,承认由于不同的版本,翻译和历史记录保存的不准确性而确定排名书籍的固有困难。 该列表不包括宗教文本,自助,政治wo

    Feb 26,2025
  • Wuthering Waves最终发行了2.0版,其中包括新的Rinascita地区

    Wuthering Wave以2.0版:新区域,角色等飙升! 备受期待的Wuther Waves版本2.0更新已经到来,可以大量扩展内容。 探索一个庞大的新区域,遇到新鲜的角色和老板,并掌握新的游戏机制。 JRPG

    Feb 26,2025
  • Jujutsu Kaisen Phantom Parade丢弃隐藏的库存/过早死亡更新

    Jujutsu Kaisen Phantom Parade的“隐藏库存/过早死亡”更新:大量内容下降! Jujutsu Kaisen Phantom Parade备受期待的“隐藏库存/过早死亡”更新已经到来,引入了Jujutsu High时代的SSR角色。 此重大更新在F中展开

    Feb 26,2025
  • 王朝勇士:起源 - 如何切换字符

    快速链接 在朝代战士中切换角色:起源 在王朝战士中扮演同伴:起源 在王朝的战士中:起源,您主要是扮演流浪者,努力争取和平。 主要故事提供了分支选择,同伴经常与您一起参加战斗。 当他们

    Feb 26,2025
  • 好消息,隐私迷 - 使用移动VPN比您想象的要容易(并且更有趣)

    保护您的Android:为什么VPN对于移动隐私至关重要 认为您没有VPN安全在线?想一想。 虽然我们不会梦想入侵您的隐私,但没有VPN浏览就像广播您的个人信息 - 名称,地址,电子邮件等等 - 所有人都可以看到。 只有一个果

    Feb 26,2025
  • 如何用Bluestacks在PC上玩Draconia Saga

    在Draconia Saga进行了一次史诗般的冒险,这是一个迷人的RPG,里面充满了神话般的生物,古老的传说和激动人心的追求。 当您探索广阔的阿卡迪亚大陆时,收集各种各样的宠物,每个宠物都有独特的能力和进化路径。 在您的DR上飙升

    Feb 26,2025