半个行内人说几句deepseek
本帖最后由 blaze 于 2025-1-29 18:19 编辑本人是做视觉的,llm的东西不是很懂细节,但是技术上其实没啥本质区别。
按照老中的标准大概ccf a 10几篇一作,cv3大会,neurips,iclr都发过一作文章。所以我就说半个行内人吧。
这次deepseek的release我感觉定位就类似于clip, sam2那种,一定会成为一个很好的,很火的工具,值得应用或者继续做downstream task。
但是这个东西并不是从0到1的工作,没有太多fundamental的贡献。历史定位大概是sam,clip这种级别,最终引用肯定不如clip,更别说transformer和那些都不需要引用的hinton的工作了。如果在nlp领域比,最多跟llama的历史地位一样,一般情况下是弱于llama。
应该说这次破圈是老中被压抑太久需要一次狂欢罢了,我个人感觉一切都没改变。
本身中国科研能力我就觉得很强,没啥弱的,只不过普通人不了解罢了。当然开创性work都是美国做的,这一点也没有改变。
影响nvda股价有点幽默了,虽然是moe但其实一样是scaling law。
补充:其实deepseek 做出来的难度远比gpt o1低,因为现在蒸馏o1现在已经是公开的秘密了,字节跳动先干的。
影响的是open ai这样拿ai服务收钱的公司,因为太便宜了。 但是这个东西并不是从0到1的工作,没有太多fundamental的贡献。 搞了半天,连瓦房店都算不上 那个外面发帖的格里高利是什么人,感觉是个偏执狂,我确实不是专业专业搞技术的,我搞投资,看中一个产品的主要不是看技术含量,而是看他能不能赚钱,deepseek这种一眼没有多大盈利前景,热度炒这么高,在结合它的背景股权结构一眼就是炒出来割韭菜的。 发出来也是提醒下不要上当,其他平台我也说过这个是割韭菜的,但没遇到像他的这么偏执的。 文畜进来加精 还是那句话,如果你看中某种技术觉得有前景,最好的支持就是买入与其相关的股票。除此之外任何的吹捧都是空谈。 看楼主发帖,应该是视觉行业类的大牛,前段时间我看openai嵌入苹果手机后,可以通过摄像头分析镜头内的物品和情景,还能和人实时对话问答,说不定就采用了你发明的算法。这方面是非常有前途有极大的盈利前景,只要和视觉类相关的行业都能应用到,比如自动驾驶,agi,以后的具身智能体,游戏,影视等等都能应用到。 能打价格战了吧 蒸馏算偷么 蒸馏算偷么 Deepseek略强于Llama 模型规模更大 有一定原创性的方法(比如GRPO)也在更大规模上验证了MoE、MLA、MTP的有效性 相对Llama给大家带来的关于模型训练的“有效信息”更多一些 很难在视觉领域找一个类似物 因为CLIP、SAM都不算普遍意义上的基础大模型 硬要找的话 有点像SD + ControlNet 华裔和中国人的科研能力不差 RoPE 前Transformer时代的ResNet 都是华人做出来的 能打价格战了吧 本帖最后由 focus 于 2025-1-30 23:13 编辑
close ai的o1 pro还是强的,deepseek r1并未超过。但deepseek开源以及论文可以验证,他们在engineering上的一些优化是真的,对AI领域的研究发展也是有推动作用的。
页:
[1]