再谈deepseek的贡献

blaze 发表于 2025-1-30 18:26:23

在谈之前首先要明确一点，engineering contribution 也是contribution。

按照社交媒体和本坛的说法，deepseek 的贡献主要是：开源，grpo (reinforcement learning), moe, fp8。

我个人分析如下：

1，开源。这个没得说，贡献很大。

2，grpo，这个说实话比较incremental。基于ppo 做的改进，类似的idea太多了，从ppo（openai 17年的文章）开始，dpo (Stanford 24年的文章）算一个milestone，之后很多很多work都在提高dpo，ppo。grpo大概率不是下一个milestone。

3，moe，这个算engineering contribution。moe最早hinton 91年就提出了，一直以来都很多很多人用，包括llm时代。deepseek的贡献在于第一次把moe做成了sota的llm。meta之前在llama上试过moe，但是没试出来。

4，自制fp8，这个也是engineering contribution，但是是比较有价值的，推广之后应该蛮多人用。当然底层还是nvidia的那套，什么摆脱cuda霸权就有点闹麻了。

blaze 发表于 2025-1-30 18:28:16

大家还有什么技术细节可以发出来讨论一下

好大一个白 发表于 2025-1-30 18:32:33

专业，我也是认为deepseek是多多少少有一些优点，但它在基础方面没有开创性，也就是0-1这方面，结果墙内媒体吹成划时代的发明，击垮美国ai产业，还有得上升到国运级别，是真的太幽默了。

赛博哥谭 发表于 2025-1-30 18:54:03

大佬，怎么看待“从来没有蒸馏o1这个说法，只有蒸馏ray”

3141592652 发表于 2025-1-30 19:24:21

康吹布油迅

moon 发表于 2025-1-30 19:37:07

全是不认识的专业名词，我说啥

focus 发表于 2025-1-30 21:35:26

openai那个mark chen的发言最搞笑了，我估计deepseek这次开源出来的东西里有close ai之前藏着掖着的东西。

奥雷里亚诺 发表于 2025-1-30 22:33:28

往细了说没有必要啊，这也不是技术论坛，差不多就行了

刁迈乎 发表于 2025-1-31 06:51:14

带专落泪

欧拉欧拉 发表于 2025-1-31 08:33:30

看哭了，以后没文化上泥潭就自闭，聊的东西都看不懂

页: [1]

哥谭's Archiver

再谈deepseek的贡献