[发明专利]一种CRISPR/Cas9脱靶效应的预测方法有效
申请号: | 201910299222.0 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110070912B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 樊永显;徐海波;张向文;张龙 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 刘梅芳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 crispr cas9 脱靶 效应 预测 方法 | ||
本发明公开了一种CRISPR/Cas9脱靶效应的预测方法,其特征在于,包括如下步骤:1)构建包含正样本和负样本的数据集;2)对样本数据集进行编码并加入特征;3)采用特征选择的方法处理样本数据;4)构建BroadLearning预测器。这种方法预测速度快、精度高。
技术领域
本发明涉及基因技术,具体是一种CRISPR/Cas9脱靶效应的预测方法。
背景技术
自CRISPR/Cas9技术首次应用于基因编辑领域以来,CRISPR/Cas9系统迅速席卷了生命科学领域,引起了基因编辑技术的巨大变革。CRISPR/Cas9系统是继锌指核酸酶、类转录激活因子效应物核酸酶之后的第三代基因组定编辑技术,可以对特定位置的DNA序列进行编辑与修改。前两代基因组编辑技术通过蛋白特异性去识别DNA序列,而CRISPR通过碱基互补配对去匹配成功长度为20nt的DNA序列,从而定位目标DNA,因此具有更好的通用性。CRISPR/Cas9系统由CRISPR序列元件和Cas9核酸酶组成。Cas9核酸酶在crRNA和tracRNA的指导下,在具有前间区序列邻近基序(PAM,通常为NGG,N为任意的碱基)的DNA双链进行靶向切割,形成DNA双链的断裂。CRISPR/Cas9系统靶向生物基因组存在潜在的脱靶效应。Cas9核酸酶对sgRNA与目标DNA序列碱基匹配具有一定的容错能力。sgRNA除了切割靶向位点DNA链以外,也可能与和靶向位点具有较高同源性的非靶向DNA序列局部匹配,激活Cas9核酸酶切割非目标DNA序列,产生脱靶效应。脱靶效应会对基因组的基因产生大量的非靶向切割,造成不可控的影响,这也是CRISPR/Cas9系统用于临床应用的最大问题。
当前的CRISPR/Cas9系统的一个重要研究方向就是预测靶向命中效率和脱靶位置,精确预测CRISPR系统与DNA序列的相互作用可以用来最大化靶向活动和最小化脱靶效应。目前大多数已有的CRISRP/Cas9脱靶效应设计工具都是简单地通过序列匹配分数和碱基错配来查找脱靶位点。另一些工具通过设计一个脱靶位点分数来预测脱靶位点的脱靶效率。目前国外的研究的脱靶效应预测主要是通过序列相似性和物理化学性质进行预测,而国内更多使用卷积神经网络对CRISPR/Cas9序列进行预测。从这些成果所采用的技术看,主要分为:基于支持向量机(SVM)(Wong N,Liu W,Wang X.WU-CRISPR:characteristics offunctional guide RNAs for the CRISPR/Cas9system.Genome Biol,2015,16:218.),基于随机森林(Abadi S,Yan WX,Amar D,Mayrose I.A machine learning approach forpredicting CRISPR-Cas9cleavage efficiencies and patterns underlying itsmechanism of action.PLoS Comput Biol,2017,13(10):e1005807.),基于卷积神经网络(Kim HK,Min S,Song M,Jung S,Choi JW,Kim Y,Lee S,Yoon S,Kim HH.Deep learningimproves prediction of CRISPR-Cpf1guide RNA activity.Nat Biotechnol,2018,36(3):239–241.),基于逻辑回归(Prykhozhij SV,Rajan V,Gaston D,Berman JN.CRISPRmultitargeter:a web tool to find common and unique CRISPR single guide RNAtargets in a set of similar sequences.PLoS One,2015,10(3):e0119372.),基于贝叶斯分析(Hart T,Moffat J.BAGEL:a computational framework for identifyingessential genes from pooled library screens.BMC Bioinformatics,2016,17:164.)。以上技术都是将机器学习方法运用到CRISPR/Cas9脱靶效应预测中。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910299222.0/2.html,转载请声明来源钻瓜专利网。