真正的技术变革和瓦房店之间的差异
看了blaze教授的帖子,虽然俺完全不懂,本身不是做那一行的,但是就像俺前一个帖子说的一样,瓦房店就是瓦房店,不行就是不行。从0到1是质变,但也不影响技术变革带来1到10或者1到50的质变,这里俺就不得不说一下经典的CRISPR Cas9 mediated editing了。
最开始发现Cas protein能够切断double stranded DNA-双链DNA,形成double stranded break-DSB,结合细胞分裂修复断裂DNA的特点,有了最传统的基因编辑技术,如下图所示。
简单来说,cas9 蛋白需要一个guide RNA-gRNA去引导Cas9结合目标基因位点,形成DNA断裂。由于细胞能够识别到基因broken,会通过细胞分裂来修补受损位点,如果没有修复模板存在,断裂的片段会被随机修复,简称NHEJ,NHEJ不是主要话题,所以不细说。通过提供设计好的修复模版,homology directed repair template简称HDR模版,细胞有机率利用该模板完成修复,实现图中的基因插入等编辑目的。
但是,即便有HDR模版的存在,也不意味着细胞能够一定能利用模版完成我们所想要的编辑。比如,6孔板内50万个细胞,通过质粒转染将cas9蛋白,gRNA和HDR模版导入到细胞中,最终可能只有一两个细胞是编辑的,其次,细胞通常都是双倍体,最后可能只有姐妹染色体中的一条是被成功编辑的,另一条依然是没有编辑的,这种hetrozygous细胞并不能用于下游实验。
后来,人们想到抑制NHEJ的酶来提高HDR修复的可能性,然后整出了nu7441这种小分子来抑制NHEJ信号通路中的DNA-PK。效果虽然有,根据不同类型的细胞,保守的说提升率可能在5成,但是依然不够客观,不过总好过没有提高。
19年,David Liu lab,一个台裔美国人的实验室搞出了一个Prime editing的技术,如下图所示。
这个lab将M-MLV reverse transcriptase,一种逆转录酶,简称RT,与Cas9蛋白融合,并且对Cas9蛋白进行了一定修改,使Cas9蛋白能切割双链DNA,但只能切割双链中的单链。同时对gRNA进行了修改,有了图中的pegRNA,pegRNA的RT端能够与HDR模版的末端互补完成hybridization,逆转录合成模版用于同源修复。
单说编辑效率相比传统的HDR修复提高了至少几十倍,而且prime editing可以不通过HDR模版就能完成特定nucleotide的突变。单链和双链断裂带来的结果也不同,双链断裂更容易造成细胞死亡,降低编辑效率,这个技术的优点太多,不一一列举。
现在做基因编辑或者定点突变,传统HDR编辑不能解决的问题,基本都用prime editing来完成,除了比较穷的组,几乎都用PE来编辑。
这种才是技术的革新。
传统HDR编辑 改了下名字,也不是巨大质变,做的也不是从无到有,这个所谓的moe真是个笑柄,还搁这儿嗯吹呢 {:23_2490:}不懂,帮顶 我把你帖子看完了,不太懂,问下这个通过基因编辑 来修复细胞的技术 是否存在医学伦理上的问题?如果没有这方面的问题的话,以后是不是可以用到伤口愈合方面?或者用在肢体 或器官再生方面? 或者用在 机械与生物体的结合上?
如果能从实验室走向临床的话,前景大为广阔,木头姐旗下的方舟基金好像就投资过类似的实验项目。 这才是技术的革新 亲爱的,我已经在帖子里说的很清晰了。DS带来的是工程上的创新。
但这不妨碍DS使用FP8、MoE带来的技术升级,不妨碍采用MLA多头隐空间注意力让推理成本进一步下降,在个人电脑上也能实现不错的效果。使用GRPO RL对存在明确答案的数理问题等场景产生的效果非常好
我是没想道您是对号入座到了不会矩阵乘法。抱歉我是真不知道生科不需要用这些,没有cue宁的意思,宁对我只是nobody。
用宁能听懂的话解释:幻方团队的主要工作是降本增效,解决了如何在成本有限、算力有限的条件下,训练出世界领先的大语言基础模型的问题。
它们带来的技术革新是:
使用 GRPO(Group Relative Polixy Optimization)的增强学习(Reinforcement Learning)策略。团队在不需要人工标注思维连的前提下,直接用问题答案作为参考,对模型输出自动评分,模型在数学和代码问题上“自然涌现”出了推理能力,你不需要海量标注数据,不需要人工设计思维链,只需回归最简单的RL(增强学习)。
所以我提到的是“新的工程范式”。
其次是世界范围内首次采用fp8(8位浮点数,一般电脑中全精度浮点为32位,8位浮点可以节省75%的空间)混合精度训练100B以上规模的大语言模型。在此过程中, DeepSeek解决了大量计算(比如哪些用fp8,哪些要用精度更高的fb32)问题,并优化了不少矩阵计算中必要的Tensor Core CUDA算子。
业内的也对新的工程方法迭代评价很高。部分工作的结果是openai曾经自己使用并未公布的(以防你产生误解,openai的主要工作也是工程上的)。
我的观点非常清晰:不懂别瞎BB。技术、背景、项目盈利、金融操作是完全不同的几个事情。谈论技术是否有创新的时候不需要掺杂这些东西。
至于国内社媒上的狂欢我并不care。我对粪坑的态度是不会把自己头塞进去再出来锐评什么味道有没有爆炸。无知者的各种评价更没价值。我自己也没准备使用DS。
本帖最后由 shyn 于 2025-1-29 21:59 编辑
生物批收收味
不懂 不懂帮顶
页:
[1]