blaze 发表于 2025-1-29 17:28:20

半个行内人说几句deepseek

本帖最后由 blaze 于 2025-1-29 18:19 编辑

本人是做视觉的,llm的东西不是很懂细节,但是技术上其实没啥本质区别。
按照老中的标准大概ccf a 10几篇一作,cv3大会,neurips,iclr都发过一作文章。所以我就说半个行内人吧。

这次deepseek的release我感觉定位就类似于clip, sam2那种,一定会成为一个很好的,很火的工具,值得应用或者继续做downstream task。
但是这个东西并不是从0到1的工作,没有太多fundamental的贡献。历史定位大概是sam,clip这种级别,最终引用肯定不如clip,更别说transformer和那些都不需要引用的hinton的工作了。如果在nlp领域比,最多跟llama的历史地位一样,一般情况下是弱于llama。

应该说这次破圈是老中被压抑太久需要一次狂欢罢了,我个人感觉一切都没改变。
本身中国科研能力我就觉得很强,没啥弱的,只不过普通人不了解罢了。当然开创性work都是美国做的,这一点也没有改变。
影响nvda股价有点幽默了,虽然是moe但其实一样是scaling law。

补充:其实deepseek 做出来的难度远比gpt o1低,因为现在蒸馏o1现在已经是公开的秘密了,字节跳动先干的。

乡下南瓜0 发表于 2025-1-29 17:30:32

影响的是open ai这样拿ai服务收钱的公司,因为太便宜了。

带带东百狗 发表于 2025-1-29 17:32:39

但是这个东西并不是从0到1的工作,没有太多fundamental的贡献。

带带东百狗 发表于 2025-1-29 17:38:03

搞了半天,连瓦房店都算不上

好大一个白 发表于 2025-1-29 17:39:43

那个外面发帖的格里高利是什么人,感觉是个偏执狂,我确实不是专业专业搞技术的,我搞投资,看中一个产品的主要不是看技术含量,而是看他能不能赚钱,deepseek这种一眼没有多大盈利前景,热度炒这么高,在结合它的背景股权结构一眼就是炒出来割韭菜的。

好大一个白 发表于 2025-1-29 17:42:48

发出来也是提醒下不要上当,其他平台我也说过这个是割韭菜的,但没遇到像他的这么偏执的。

带带东百狗 发表于 2025-1-29 17:44:21

文畜进来加精

好大一个白 发表于 2025-1-29 17:45:35

还是那句话,如果你看中某种技术觉得有前景,最好的支持就是买入与其相关的股票。除此之外任何的吹捧都是空谈。

好大一个白 发表于 2025-1-29 18:18:32

看楼主发帖,应该是视觉行业类的大牛,前段时间我看openai嵌入苹果手机后,可以通过摄像头分析镜头内的物品和情景,还能和人实时对话问答,说不定就采用了你发明的算法。这方面是非常有前途有极大的盈利前景,只要和视觉类相关的行业都能应用到,比如自动驾驶,agi,以后的具身智能体,游戏,影视等等都能应用到。

kuso 发表于 2025-1-29 18:19:04

能打价格战了吧

嘿嘿哈哈 发表于 2025-1-29 18:49:55

蒸馏算偷么

duck 发表于 2025-1-29 19:07:58

蒸馏算偷么

fmndx 发表于 2025-1-29 19:44:47

Deepseek略强于Llama 模型规模更大 有一定原创性的方法(比如GRPO)也在更大规模上验证了MoE、MLA、MTP的有效性 相对Llama给大家带来的关于模型训练的“有效信息”更多一些 很难在视觉领域找一个类似物 因为CLIP、SAM都不算普遍意义上的基础大模型 硬要找的话 有点像SD + ControlNet 华裔和中国人的科研能力不差 RoPE 前Transformer时代的ResNet 都是华人做出来的

刁迈乎 发表于 2025-1-29 20:41:31

能打价格战了吧

focus 发表于 2025-1-30 23:11:14

本帖最后由 focus 于 2025-1-30 23:13 编辑

close ai的o1 pro还是强的,deepseek r1并未超过。但deepseek开源以及论文可以验证,他们在engineering上的一些优化是真的,对AI领域的研究发展也是有推动作用的。
页: [1]
查看完整版本: 半个行内人说几句deepseek