半个行内人说几句deepseek

blaze 发表于 2025-1-29 17:28:20

本帖最后由 blaze 于 2025-1-29 18:19 编辑

本人是做视觉的，llm的东西不是很懂细节，但是技术上其实没啥本质区别。
按照老中的标准大概ccf a 10几篇一作，cv3大会，neurips，iclr都发过一作文章。所以我就说半个行内人吧。

这次deepseek的release我感觉定位就类似于clip, sam2那种，一定会成为一个很好的，很火的工具，值得应用或者继续做downstream task。
但是这个东西并不是从0到1的工作，没有太多fundamental的贡献。历史定位大概是sam,clip这种级别，最终引用肯定不如clip，更别说transformer和那些都不需要引用的hinton的工作了。如果在nlp领域比，最多跟llama的历史地位一样，一般情况下是弱于llama。

应该说这次破圈是老中被压抑太久需要一次狂欢罢了，我个人感觉一切都没改变。
本身中国科研能力我就觉得很强，没啥弱的，只不过普通人不了解罢了。当然开创性work都是美国做的，这一点也没有改变。
影响nvda股价有点幽默了，虽然是moe但其实一样是scaling law。

补充：其实deepseek 做出来的难度远比gpt o1低，因为现在蒸馏o1现在已经是公开的秘密了，字节跳动先干的。

乡下南瓜0 发表于 2025-1-29 17:30:32

影响的是open ai这样拿ai服务收钱的公司，因为太便宜了。

带带东百狗 发表于 2025-1-29 17:32:39

但是这个东西并不是从0到1的工作，没有太多fundamental的贡献。

带带东百狗 发表于 2025-1-29 17:38:03

搞了半天，连瓦房店都算不上

好大一个白 发表于 2025-1-29 17:39:43

那个外面发帖的格里高利是什么人，感觉是个偏执狂，我确实不是专业专业搞技术的，我搞投资，看中一个产品的主要不是看技术含量，而是看他能不能赚钱，deepseek这种一眼没有多大盈利前景，热度炒这么高，在结合它的背景股权结构一眼就是炒出来割韭菜的。

好大一个白 发表于 2025-1-29 17:42:48

发出来也是提醒下不要上当，其他平台我也说过这个是割韭菜的，但没遇到像他的这么偏执的。

带带东百狗 发表于 2025-1-29 17:44:21

文畜进来加精

好大一个白 发表于 2025-1-29 17:45:35

还是那句话，如果你看中某种技术觉得有前景，最好的支持就是买入与其相关的股票。除此之外任何的吹捧都是空谈。

好大一个白 发表于 2025-1-29 18:18:32

看楼主发帖，应该是视觉行业类的大牛，前段时间我看openai嵌入苹果手机后，可以通过摄像头分析镜头内的物品和情景，还能和人实时对话问答，说不定就采用了你发明的算法。这方面是非常有前途有极大的盈利前景，只要和视觉类相关的行业都能应用到，比如自动驾驶，agi，以后的具身智能体，游戏，影视等等都能应用到。

kuso 发表于 2025-1-29 18:19:04

能打价格战了吧

嘿嘿哈哈 发表于 2025-1-29 18:49:55

蒸馏算偷么

duck 发表于 2025-1-29 19:07:58

蒸馏算偷么

fmndx 发表于 2025-1-29 19:44:47

Deepseek略强于Llama 模型规模更大有一定原创性的方法（比如GRPO）也在更大规模上验证了MoE、MLA、MTP的有效性相对Llama给大家带来的关于模型训练的“有效信息”更多一些很难在视觉领域找一个类似物因为CLIP、SAM都不算普遍意义上的基础大模型硬要找的话有点像SD + ControlNet 华裔和中国人的科研能力不差 RoPE 前Transformer时代的ResNet 都是华人做出来的

刁迈乎 发表于 2025-1-29 20:41:31

能打价格战了吧

focus 发表于 2025-1-30 23:11:14

本帖最后由 focus 于 2025-1-30 23:13 编辑

close ai的o1 pro还是强的，deepseek r1并未超过。但deepseek开源以及论文可以验证，他们在engineering上的一些优化是真的，对AI领域的研究发展也是有推动作用的。

页: [1]

哥谭's Archiver

半个行内人说几句deepseek