[发明专利]一种基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法在审
申请号: | 202110704166.1 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113450875A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 王帅;许志晖;王海彦;王舒 | 申请(专利权)人: | 南京农业大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B25/20;G16B20/20;G16B20/50;G16B20/30;G16B40/00;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 苏虹 |
地址: | 210095 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 brnn 模型 统计 检验 rna m6a 修饰 鉴定 方法 | ||
本发明公开了一种基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法,结合eCLIP实验流程构建了meCLIP标准文库和简化流程的文库;在分析meCLIP数据在m6A位点上下游的截断和突变特征后,开发了相关软件用于在单碱基水平上鉴定m6A位点,且更简便快速制备m6A单位点鉴定用文库。
技术领域
本发明涉及一种RNAm6A修饰位点鉴定方法,特别是涉及一种基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法。
背景技术
m6A修饰在mRNA和lncRNA上分布广泛,具有多样的生物学功能,涉及mRNA剪切、转运出核、稳定性和翻译效率等多个方面。然而,m6A的研究却不像5mC或m5C那样,可以使用重亚硫酸盐处理将未甲基化的胞嘧啶转化成尿嘧啶,通过鉴定测序结果中碱基的转换从而精确鉴定和定量甲基化修饰水平。随着对m6A功能研究的开展,如何在单碱基水平上正确鉴定出m6A位点已成为限制深入研究的主要因素。
单碱基水平的m6A鉴定的高通量方法主要有三种:miCLIP-seq(m6Aindividual-nucleotide resolution cross-linking and immunoprecipitation)、Mazter-seq(MazFdigestion)和DART-seq(deamination adjacent to RNA modification targets)。其中Mazter-seq局限于MazF酶切位点ACA序列,而DART-seq则受制于融合蛋白对m6A模式序列的识别。miCLIP-seq不受酶切效率和融合蛋白识别位点限制,理论上可以根据氨基酸残基产生的截断和突变的位置来识别所有可能的m6A位点。然而其复杂的流程减少了最终RNA的回收量和文库复杂度,需要增加PCR扩增循环数来弥补,导致测序后可用数据极少。
发明内容
发明目的:为了克服现有技术中的不足,本发明的目的是提供一种基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法,针对meCLIP数据,可以在单碱基水平准确鉴定m6A修饰位点。
技术方案:本发明的一种基于BRNN(bidirectional recurrent neural network)模型和统计检验的RNA m6A修饰位点的鉴定方法,包括以下步骤,
(1)选取样本,并划分为训练集、验证集和测试集;
(2)构建双向循环神经网络,用于将含有和不含有m6A的序列进行分类;
(3)利用训练集和验证集中序列的尖端和突变特征对所构建的双向循环神经网络进行训练,优化神经网络模型参数;
(4)利用测试集中的碱基序列样本对优化后的双向循环网络进行测试,统计识别结果;
(5)将识别为保护m6A的碱基序列按照边缘reads覆盖度的差异进行合并处理;
(6)对A及其下游1nt的截断数量统计检验,得到m6A单位点鉴定结果。
步骤(1)中,提取位于RIP-seq(methyl-RNA immunoprecipitation)中m6A修饰区间内的CTKtools(CLIP tools kit)鉴定出的m6A位点周围的序列截断和突变信息作为正例,随机选取不含A的序列作为负例,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京农业大学,未经南京农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110704166.1/2.html,转载请声明来源钻瓜专利网。