CRISPR-Cas9 原理
CRISPR/Cas技术是什么?
CRISPR/Cas系统是一种原核生物的免疫系统,用来抵抗外源遗传物质的入侵,比如噬菌体病毒和外源质粒。同时,它为细菌提供了获得性免疫:这与哺乳动物的二次免疫类似,当细菌遭受病毒或者外源质粒入侵时,会产生相应的“记忆”,从而可以抵抗它们的再次入侵。CRISPR/Cas系统可以识别出外源DNA,并将它们切断,沉默外源基因的表达。这与真核生物中RNA干扰(RNAi)的原理是相似的。正是由于这种精确的靶向功能,CRISPR/Cas系统被开发成一种高效的基因编辑工具。在自然界中,CRISPR/Cas系统拥有多种类别,其中CRISPR/Cas9系统是研究最深入,应用最成熟的一种类别。CRISPR/Cas9是继锌指核酸内切酶(ZFN)”、“类转录激活因子效应物核酸酶(TALEN)”之后出现的第三代“基因组定点编辑技术”。凭借着成本低廉,操作方便,效率高等优点,CRISPR/Cas9迅速风靡全球的实验室,成为了生物科研的有力帮手。在TALEN和ZFN的时代,科学家们往往要花费重金,把基因编辑工作交给生物公司。而现在,在实验室里,人们就可以使用CRISPR/Cas9技术轻松的实现基因编辑。
CRISPR/Cas9如何工作?
CRISPR簇是一个广泛存在于细菌和古生菌基因组中的特殊DNA重复序列家族,充当了防御外源遗传物质的“基因武器”。CRISPR全称Clustered Regularly Interspersed Short Palindromic Repeats—成簇的规律间隔的短回文重复序列,分布在40%的已测序细菌和90%的已测序古细菌当中。图1展示了完整的CRISPR位点的结构。其中,CRISPR序列由众多短而保守的重复序列区(repeats)和间隔区(spacer)组成。重复序列区含有回文序列,可以形成发卡结构。而间隔区比较特殊,它们是被细菌俘获的外源DNA序列。这就相当于细菌免疫系统的“黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas系统就会予以精确打击。而在上游的前导区(leader)被认为是CRISPR序列的启动子。另外,在上游还有一个多态性的家族基因,该基因编码的蛋白均可与CRISPR序列区域共同发生作用。因此,该基因被命名为CRISPR关联基因(CRISPR associated,Cas)。目前已经发现了Cas1-Cas10等多种类型的Cas基因。Cas基因与CRISPR序列共同进化,形成了在细菌中高度保守的CRISPR/Cas系统。
那么,CRISPR序列是如何与Cas蛋白配合来执行防御功能的呢?整个过程大体分为3步。
1.外源DNA俘获:“黑名单”登记
简单来说,CRISPR/Cas系统在这一步实现了一个“黑名单登记”功能。CRISPR/Cas系统将识别出入侵者的“名字”(PAM)并找到它的“身份证”(原间隔序列),然后把入侵者身份信息作为“档案”(间隔序列)记录到“黑名单”(CRISPR序列)中。图2展示了第一阶段的工作原理。当噬菌体病毒首次入侵宿主细菌,病毒的双链DNA被注入细胞内部。CRISPR/Cas系统会从这段外源DNA中截取一段序列作为外源DNA的“身份证”,然后将其作为新的间隔序列被整合到基因组的CRISPR序列之中。因此,这段与间隔序列对应的“身份证”被称为原间隔序列(protospacer)。然而,“身份证”的选取并不是随机的。原间隔序列向两端延伸的几个碱基都十分保守,被称为原间隔序列临近基序(protospacer adjacent motif,PAM)。PAM通常由NGG三个碱基构成(N为任意碱基)。病毒入侵时,Cas1和Cas2编码的蛋白将扫描这段外源DNA,并识别出PAM区域,然后将临近PAM的DNA序列作为候选的原间隔序列。随后,Cas1/2蛋白复合物将原间隔序列从外源DNA中剪切下来,并在其他酶的协助下将原间隔序列插入临近CRISPR序列前导区的下游。然后,DNA会进行修复,将打开的双链缺口闭合。这样一来,一段新的间隔序列就被添加到了基因组的CRISPR序列之中。
2. crRNA合成:”军火“制造
战争总需要武器,CRISPR/Cas系统也要制造足够的”军火“来打击入侵者。目前的研究表明,CRISPR/Cas系统共有三种方式(Type Ⅰ、Ⅱ、Ⅲ)来制造”军火“。CRISPR/Cas9系统属于Type Ⅱ,是目前最成熟也是应用最广的类型。因此,图3将重点介绍CRISPR/Cas9的原理。当入侵者到来,CRISPR序列会在”指挥官“(前导区)的调控下转录出两种“军火材料”:pre-CRISPR-derived RNA (pre-crRNA)和trans-acting crRNA(tracrRNA)。其中,tracrRNA是由重复序列区转录而成的具有发卡结构的RNA,而pre-crRNA是由整个CRISPR序列转录而成的大型RNA分子。随后,pre-crRNA,tracrRNA以及Cas9编码的蛋白将会组装成一个小型“兵工厂”。它将根据入侵者的类型,选取对应的“身份证”(间隔序列RNA),并在RNase Ⅲ的协助下对这段间“身份证”进行剪切,最终形成一段短小的crRNA(包含单一种类的间隔序列RNA以及部分重复序列区)。crRNA,Cas9以及tracrRNA组成的复合物,就是最终的“战斗武器”。
3.靶向干扰:强大火力,精确打击
武器已经制造完成,战争就要打响。图4展示了靶向干扰的过程。Cas9/tracrRNA/crRNA复合物就像是一枚制导导弹,可以对入侵者的DNA进行精确的打击。这个复合物将扫描整个外源DNA序列,并识别出与crRNA互补的原间隔序列。这时,复合物将定位到PAM/原间隔序列的区域,DNA双链将被解开,形成R-Loop。crRNA将与互补链杂交,而另一条链则保持游离状态。随后,Cas9蛋白发起猛烈攻势,其HNH酶活性将剪切crRNA互补的DNA链,而其RuvC活性位点将剪切非互补链。最终,Cas9强大的火力使双链断裂(DSB)形成,外源DNA的表达被沉默,入侵者被一举歼灭。
如何应用CRISPR/Cas技术?
CRISPR/Cas是进行基因编辑的强大工具,可以对基因进行定点的精确编辑。在向导RNA(guide RNA,gRNA)和Cas9蛋白的参与下,待编辑的细胞基因组DNA将被看作病毒或外源DNA,被精确剪切。但是,CRISPR/Cas9的应用也有一些限制条件。首先,待编辑的区域附近需要存在相对保守的PAM序列(NGG)。其次,向导RNA要与PAM上游的序列碱基互补配对。图5展示了最基础的两种CRISPR/Cas9技术应用。以基因敲除为例,在待敲除基因的上下游各设计一条向导RNA(向导RNA1,向导RNA2),将其与含有Cas9蛋白编码基因的质粒一同转入细胞中,向导RNA通过碱基互补配对可以靶向PAM附近的目标序列,Cas9蛋白会使该基因上下游的DNA双链断裂。而生物体自身存在着DNA损伤修复的应答机制,会将断裂上下游两端的序列连接起来,从而实现了细胞中目标基因的敲除。如果在此基础上为细胞引入一个修复的模板质粒(供体DNA分子),这样细胞就会按照提供的模板在修复过程中引入片段插入或定点突变。这样就可以实现基因的替换或者突变。对受精卵细胞进行基因编辑,并将其导入代孕母体中,可以实现基因编辑动物模型的构建。随着研究的深入,CRISPR/Cas技术已经被广泛的应用。除了基因敲除,基因替换等基础编辑方式,它还可以被用于基因激活,疾病模型构建,甚至是基因治疗。
crispr/cas9技术的原理与应用
crispr/cas9技术的原理与应用如下:对于CRISPR-Cas9的作用机理可以分为三个阶段来理解。1、第一阶段:CRISPR的高度可变的间隔区的获得(俘获外源DNA,登记“黑名单”)CRISPR的高度可变的间隔区获得,其实就是指外来入侵的噬菌体或是质粒DNA的一小段DNA序列被整合到宿主菌的基因组,整合的位置位于CRRSPR的5'端的两个重复序列之间。2、第二阶段:CRIPSR基因座的表达(包括转录和转录后的成熟加工)CRISPR序列在前导区的调控下转录产生pre-crRNA(crRNA的前体),同时与pre-crRNA序列互补的tracrRNA(反式激活crRNA)也被转录出来。pre-crRNA通过碱基互补配对与tracrRNA形成双链RNA并与Cas9编码的蛋白组装成一个复合体。3、第三阶段:CRISPR/Cas系统活性的发挥(靶向干扰)crRNA,Cas9以及tracrRNA组成最终的复合物就像是一枚制导导弹,可以对入侵者的DNA进行精确的打击。这个复合物将扫描整个外源DNA序列,并识别出与crRNA互补的原间隔序列。CRISPR-Cas9的广泛应用:基因敲除(Knock-out)Cas9可以对靶基因组进行剪切,形成DNA的双链断裂。在通常情况下,细胞会采用高效的非同源末端连接方式(NHEJ)对断裂的DNA进行修复。但是,在修复过程中通常会发生碱基插入或缺失的错配现象,造成移码突变,使靶标基因失去功能,从而实现基因敲除。基因抑制、基因激活(Repression or Activation):Cas9的特点是能够自主结合和切割目的基因,通过点突变的方式使Cas9的两个结构域RuvC-和HNH-失去活性,形成的dCas9只能在sgRNA的介导下结合靶基因,而不具备剪切DNA的功能。因此,将dCas9结合到基因的转录起始位点,可以阻断转录的开始,从而抑制基因表达;将dCas9结合到基因的启动子区域也可以结合转录抑制/活化物,使下游靶基因转录受到抑制或激活。因此dCas9与Cas9、Cas9 nickase的不同之处在于,dCas9造成的激活或者抑制是可逆的,并不会对基因组DNA造成永久性的改变。
CAS基本原理
假定有两个操作A和B(A和B可能都很复杂),如果从执行A的线程来看,当另一个线程执行B时,要么将B全部执行完,要么完全不执行B,那么A和B对彼此来说是原子的。 实现原子操作可以使用锁,锁机制,满足基本的需求是没有问题的了,但是有的时候我们的需求并非这么简单,我们需要更有效,更加灵活的机制,synchronized关键字是基于阻塞的锁机制,也就是说当一个线程拥有锁的时候,访问同一资源的其它线程需要等待,直到该线程释放锁, 这里会有些问题:首先,如果被阻塞的线程优先级很高很重要怎么办?其次,如果获得锁的线程一直不释放锁怎么办?(这种情况是非常糟糕的)。还有一种情况,如果有大量的线程来竞争资源,那CPU将会花费大量的时间和资源来处理这些竞争,同时,还有可能出现一些例如死锁之类的情况,最后,其实锁机制是一种比较粗糙,粒度比较大的机制,相对于像计数器这样的需求有点儿过于笨重。 实现原子操作还可以使用当前的处理器基本都支持CAS()的指令,只不过每个厂家所实现的算法并不一样,每一个CAS操作过程都包含三个运算符:一个内存地址V,一个期望的值A和一个新值B,操作的时候如果这个地址上存放的值等于这个期望的值A,则将地址上的值赋为新值B,否则不做任何操作。 CAS的基本思路 就是,如果这个地址上的值和期望的值相等,则给其赋予新值,否则不做任何事儿,但是要返回原值是多少。循环CAS就是在一个循环里不断的做cas操作,直到成功为止。 原子更新基本类型的AtomicInteger,只能更新一个变量,如果要原子更新多个变量,就需要使用这个原子更新引用类型提供的类。Atomic包提供了以下3个类。
CAS的原理
在讲述原理之前,先了解两个在CA设备中容易混淆的概念:一个是加解扰(Scrambling-Descrambling),另一个是加解密 (Encryption-Decryption)。加解扰技术被用来在发送端CA系统的控制下改变或控制被传送的服务(节目)的某些特征,使未被授权的用 户无法获取该服务提供的利益;而加密技术被用来在发送端提供一个加密信息,使被授权的用户端解扰器能以此来对数据解密,该信息受CA系统控制,并以加密形 式配置在传输流信息中以防止非授权用户直接利用该信息进行解扰,不同的CA系统管理和传送该信息的方法有很大不同。简单地说就是:加扰是通过控制字(CW,Control word)对传输流进行按位加密的过程,而加密部分实际完成对控制字(CW)的保护。这两种技术是CA系统重要的组成部分,在技术上有相似之处,但在CA系统标准中是独立性很强的两个部分。在目前各标准组织提出的条件接收标准中,加扰部分往往力求统一,而在加密部分则一般不作具体规定,是由各厂商定义的部分。条件接收的核心是控制字CW传输的控制。在采用MPEG-2标准的数字电视系统中,与节目流条件接收系统相关的有两个数据流:授权控制信息 ECM(Entitle Control Message)和授权管理信息EMM(Entitle Manage Message)。由业务密钥SK(Service Key)加密处理后的CW在ECM中传送,ECM中还包括节目来源、时间、内容分类和节目价格等节目信息。对CW加密的SK在EMM中传送,而SK在传送 前要经过用户个人分配密钥PDK(Personal Distribute Key)的加密处理,EMM中还包含地址、用户授权信息。起始控制字(CW)作为解扰密钥使用。解扰密钥是系统安全的基本要素。为此对CW本身(以及系统数据的其他部分)要用一个加密密钥通过加密算法对它进行 加密保护,这个加密密钥只是一个用来变化加密算法结果的任意数。固定这个密钥是不适用的(安全性差),应当采用变化密钥,通过CA控制器用人工的或其他自 然方式产生新的随机数。在具体应用中,通常由服务提供商产生用来控制其提供的服务,所以把它称为业务密钥SK。SK的使用和用户付费条件有关。CW虽已由SK加密,但这个密钥如果还是可以让任何人读取,网络运营商还是难以控制到特定的用户,安全性还是存在问题,必须对SK再进行加密保护。由于 共用网络寻址模式中数据包是按用户地址传送的,每个终端设备有一个不重复的惟一的地址码,就可以采用地址码来对SK加密。在实际 使用中,终端设备的地址一般是公开的,且基本不变,所以往往用和这个地址码相关联的一个数列来进行加密,称为个人分配密钥(PDK)。PDK一般由CA系 统设备自动产生并严格控制,在终端设备处该序列数一般由网络运营商通过CA系统提供的专用设备烧入解扰器的PROM中,不能再读出。一套CA系统往往为每 个用户分配好几个PDK,以满足丰富的业务需求。运营商对终端用户的加密授权方式有很多种,而智能卡授权方式是目前机顶盒市场的主流,也被我国广电总局确定为我国入网设备的标准配件。