[发明专利]一种RNA序列中M5C位点的识别预测方法及系统在审
申请号: | 202010832292.0 | 申请日: | 2020-08-18 |
公开(公告)号: | CN111951889A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 祝小雷;周巍巍;王红;刘宇峰;陈潇 | 申请(专利权)人: | 安徽农业大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G06N20/10;G06K9/62;G06Q10/04 |
代理公司: | 合肥昊晟德专利代理事务所(普通合伙) 34153 | 代理人: | 王林 |
地址: | 230000 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 rna 序列 m5c 识别 预测 方法 系统 | ||
本发明公开了一种RNA序列中M5C位点的识别预测方法及系统,属于M5C位点预测技术领域,包括以下步骤:S1:构建基准数据集;S2:利用特征表示RNA片段;S3:对特征进行优化选择;S4:构建预测模型;S5:利用模型进行预测。本发明构建了一个平衡的数据集Mat372,在此数据集的基础上,利用KNF、KSNPF和pseDNC三个特征对RNA片段进行编码,对特征进行优化选择后,利用SVM建立了M5C‑NSGAII预测模型,能够对RNA序列中的5‑甲基胞嘧啶(M5C)位点进行准确识别,值得被推广使用。
技术领域
本发明涉及M5C位点预测技术领域,具体涉及一种RNA序列中M5C位点的识别预测方法及系统。
背景技术
自然界中,DNA的转录后加工与修饰是一种常见的现象,RNA的代谢过程和功能受特定RNA序列基序、RNA形成二级结构并组装成核糖核蛋白复合物的能力的影响。基于上述效应,记录这些分子的转录后修饰过程和程度,如剪切输出、免疫耐受等,具有重要意义。因此,人们越来越重视研究转录后修饰在RNA中的发生率和生物学相关性。5-甲基胞嘧啶(5-methylcytosine,M5C)是RNA中的一类高丰度的转录后修饰(PTCM),已经在多种生物中被发现。通过RNA甲基转移酶的作用,RNA序列中的胞嘧啶的第5位碳原子发生修饰,被转换成M5C。M5C在tRNA二级结构的稳定性、氨基酸酰化和密码子识别、应激反应调控等生物学过程中发挥着重要的作用,从而得到了广泛的研究。精确识别RNA序列中M5C位点,对于理解M5C的功能作用和机制具有重要意义和帮助。
一些实验方法,比如亚硫酸氢盐测序、M5C-rip、Aza-IP或miCLIP等已被开发用来识别M5C位点。亚硫酸氢盐测序使用亚硫酸氢盐来处理核酸序列,没有甲基化的胞嘧啶会转化为尿嘧啶,而甲基化的胞嘧啶不发生改变,可以由此识别位点。M5C-rip技术来源于RNA结合蛋白免疫沉淀(RNABindingProteinImmunoprecipitation),RNA BindingProteinImmunoprecipitation是研究细胞内RNA和蛋白结合情况的一种技术,是了解转录后调控网络动态过程的强有力工具,并且可以帮助找到miRNA的调节靶点。RIP是一种新兴的技术,运用针对目标蛋白的抗体沉淀出相应的RNA-蛋白复合物,然后经过分离纯化,结合在复合物上的RNA就可以被分析。RIP可以被视为一个类似普遍使用的染色质免疫沉淀ChIP技术的应用,但由于研究对象是RNA-蛋白复合物而不是DNA-蛋白复合物,RIP的优化条件实验不同于ChIP实验(如复合物不需要固定,RIP反应体系中的试剂和抗体必须不包含RNA酶,抗体需要通过RIP实验进行验证等等)。通过将PCR产物克隆成载体并加以测序,可以提升测序的成功概率,这种方法称为BSP-克隆测序法。miCLIP可以交联RNA-m6A抗体结合位点,当抗体结合的RNA被逆转录时,这些特异性位点会发生突变。这种独有的突变特征(例如,C-T转换或截短)的测序可以精确定位m6a,然后在此基础上发展一个可定位M5C的方法。然而,这些技术既费时又昂贵,此外,测序技术的快速发展导致RNA序列的爆炸性增长,这就需要更快、更经济的分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽农业大学,未经安徽农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010832292.0/2.html,转载请声明来源钻瓜专利网。