blaze 发表于 2025-1-30 18:26:23

再谈deepseek的贡献

在谈之前首先要明确一点,engineering contribution 也是contribution。

按照社交媒体和本坛的说法,deepseek 的贡献主要是:开源,grpo (reinforcement learning), moe, fp8。


我个人分析如下:

1,开源。这个没得说,贡献很大。

2,grpo,这个说实话比较incremental。基于ppo 做的改进,类似的idea太多了,从ppo(openai 17年的文章)开始,dpo (Stanford 24年的文章)算一个milestone,之后很多很多work都在提高dpo,ppo。grpo大概率不是下一个milestone。

3,moe,这个算engineering contribution。moe最早hinton 91年就提出了,一直以来都很多很多人用,包括llm时代。deepseek的贡献在于第一次把moe做成了sota的llm。meta之前在llama上试过moe,但是没试出来。

4,自制fp8,这个也是engineering contribution,但是是比较有价值的,推广之后应该蛮多人用。当然底层还是nvidia的那套,什么摆脱cuda霸权就有点闹麻了。

blaze 发表于 2025-1-30 18:28:16

大家还有什么技术细节可以发出来讨论一下

好大一个白 发表于 2025-1-30 18:32:33

专业,我也是认为deepseek是多多少少有一些优点,但它在基础方面没有开创性,也就是0-1这方面,结果墙内媒体吹成划时代的发明,击垮美国ai产业,还有得上升到国运级别,是真的太幽默了。

赛博哥谭 发表于 2025-1-30 18:54:03

大佬,怎么看待“从来没有蒸馏o1这个说法,只有蒸馏ray”

3141592652 发表于 2025-1-30 19:24:21

康吹布油迅

moon 发表于 2025-1-30 19:37:07

全是不认识的专业名词,我说啥

focus 发表于 2025-1-30 21:35:26

openai那个mark chen的发言最搞笑了,我估计deepseek这次开源出来的东西里有close ai之前藏着掖着的东西。

奥雷里亚诺 发表于 2025-1-30 22:33:28

往细了说没有必要啊,这也不是技术论坛,差不多就行了

刁迈乎 发表于 2025-1-31 06:51:14

带专落泪

欧拉欧拉 发表于 2025-1-31 08:33:30

看哭了,以后没文化上泥潭就自闭,聊的东西都看不懂
页: [1]
查看完整版本: 再谈deepseek的贡献