[发明专利]一种基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法在审
申请号: | 202110704166.1 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113450875A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 王帅;许志晖;王海彦;王舒 | 申请(专利权)人: | 南京农业大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B25/20;G16B20/20;G16B20/50;G16B20/30;G16B40/00;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 苏虹 |
地址: | 210095 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 brnn 模型 统计 检验 rna m6a 修饰 鉴定 方法 | ||
1.一种基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法,其特征在于:包括以下步骤,
(1)选取样本,并划分为训练集、验证集和测试集;
(2)构建双向循环神经网络,用于将含有和不含有m6A的序列进行分类;
(3)利用训练集和验证集中序列的尖端和突变特征对所构建的双向循环神经网络进行训练,优化神经网络模型参数;
(4)利用测试集中的碱基序列样本对优化后的双向循环网络进行测试,统计识别结果;
(5)将识别为保护m6A的碱基序列按照边缘reads覆盖度的差异进行合并处理;
(6)对A及其下游1nt的截断数量统计检验,得到m6A单位点鉴定结果。
2.根据权利要求1所述的基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法,其特征在于:步骤(1)中,提取位于RIP-seq中m6A修饰区间内的CTKtools鉴定出的m6A位点周围的序列截断和突变信息作为正例,随机选取不含A的序列作为负例。
3.根据权利要求1所述的基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法,其特征在于:负例样本从蛋白编码基因上随机抽取,并满足以下要求:1)不在已鉴定的m6A位点10nt的范围内;2)m6A位点上下游10nt内不含有A。
4.根据权利要求1所述的基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法,其特征在于:CTKtools鉴定的用于构成正例的m6A位点需要满足以下要求:1)位于meRIP的m6A修饰区间内;2)统计meRIP数据相应m6A修饰区间的IP reads和Input reads的覆盖度,保留IP reads/Input reads≥2的m6A位点。
5.根据权利要求1所述的基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法,其特征在于:还包括对样本特征提取及标准化处理,统计meCLIP-gelfree数据中正负例样本的reads截断和突变数量,如果该样本序列上的reads截断或突变大于11个则保留。
6.根据权利要求1所述的基于BRNN模型和统计检验的RNA m6A修饰位点的鉴定方法,其特征在于:步骤(5)中,通过计算m6A序列左右边界上的reads覆盖度进行合并处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京农业大学,未经南京农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110704166.1/1.html,转载请声明来源钻瓜专利网。