贵支deepfake站在牛顿的肩膀上都做不出点东西

带带东百狗 发表于 2025-2-5 18:39:58

https://semianalysis.com/2025/01/31/deepseek-debates/
DeepSeek Debates: Chinese Leadership On Cost, True Training Cost, Closed Model Margin Impacts H100 Pricing Soaring, Subsidized Inference Pricing, Export Controls, MLA

看不懂的自行翻译

别鸡巴丢人现眼了，点草四字绿猪，你绿教阿拉真主允许你搞lgbtq了&#128052

Nishigori 发表于 2025-2-5 18:41:34

不是单方面宣布胜利了嘛

卡拉是条狗 发表于 2025-2-5 18:43:17

deepseek在中文方面确实不错，其它一般般

No[o]ne-1 发表于 2025-2-5 19:11:03

你应该就是看不懂的那个吧

奥雷里亚诺 发表于 2025-2-5 19:30:40

怕你读不懂让AI总结了一下，至于做没做出东西只能交给懂哥来评价了

这篇文章主要讨论了DeepSeek的崛起及其在AI领域的影响。以下是文章的主要观点总结：
DeepSeek的崛起：DeepSeek在全球范围内引起了广泛关注，其日流量已经超过了Claude、Perplexity和Gemini等竞争对手。尽管DeepSeek并不是一个新公司，但最近的热潮使其成为焦点。
高效的计算资源利用：DeepSeek被认为非常高效，以至于不再需要更多的计算资源，这导致了计算资源的过剩。文章指出，这种高效性对Nvidia和GPU市场产生了影响。
与High-Flyer的关系：DeepSeek是由中国的对冲基金High-Flyer孵化的，后者在2021年投资了大量的A100 GPU。DeepSeek和High-Flyer共享资源，并且DeepSeek已经成长为一个严肃的AI项目，拥有超过5000万美元的GPU投资。
GPU资源：DeepSeek拥有大约50,000个Hopper GPU，其中包括10,000个H800和10,000个H100。这些GPU用于交易、推理、训练和研究。
人才招聘：DeepSeek主要从中国招聘人才，注重能力和好奇心，而不是过往的资历。他们提供高达130万美元的年薪，吸引了大量优秀人才。
成本和性能：DeepSeek的V3模型训练成本被误认为是600万美元，但实际成本远高于此。文章强调，开发新架构和进行实验的成本非常高。
算法进步：DeepSeek的V3模型在性能上超过了GPT-4o，但这并不令人惊讶，因为AI算法的改进速度非常快。DeepSeek的多头潜在注意力（MLA）技术显著降低了推理成本。
与其他模型的比较：DeepSeek的R1模型在推理能力上与o1相当，但在某些基准测试中表现不及o1。尽管如此，DeepSeek在短时间内取得了显著进步，尤其是在中国背景下。
技术创新：DeepSeek在训练和推理方面的多项技术创新，包括多令牌预测（MTP）和混合专家模型（MoE），使其在成本和性能上取得了显著优势。
未来展望：文章预测，DeepSeek的改进将很快被西方实验室复制，并且AI行业的成本结构将继续下降。DeepSeek的成功展示了一个小型、资金充足且专注的初创公司如何在AI领域推动边界。
总的来说，文章认为DeepSeek在AI领域取得了显著成就，并且其高效的计算资源利用和技术创新使其在全球范围内引起了广泛关注。

另外你们那行都流行丢篇媒体文章来论证观点的吗？

moon 发表于 2025-2-5 20:14:18

奥雷里亚诺

duck 发表于 2025-2-5 20:14:57

奥雷里亚诺

dltcnn 发表于 2025-2-6 03:17:10

带神玩碎！带神玩碎！带神玩碎！带神玩碎！带神玩碎！带神玩碎！带神玩碎！

页: [1]

哥谭's Archiver

贵支deepfake站在牛顿的肩膀上都做不出点东西