[发明专利]一种预测影响长非编码RNA生物学功能的SNP位点的方法有效

专利信息
申请号: 201810122529.9 申请日: 2018-02-07
公开(公告)号: CN108319818B 公开(公告)日: 2018-12-07
发明(设计)人: 陈小伟;范珍;陈润生 申请(专利权)人: 中国科学院生物物理研究所
主分类号: G06F19/22 分类号: G06F19/22;G06F19/20
代理公司: 北京纪凯知识产权代理有限公司 11245 代理人: 关畅
地址: 100101*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种预测影响长非编码RNA生物学功能的SNP位点的方法。本发明首先建立了长非编码RNA所包含的RNA结合蛋白能够识别的特异的motif序列的识别及显著性评价方法,然后基于此方法对位于这些特定序列中的SNP位点所产生的影响进行评价。利用此方法可以发现对长非编码RNA生物学功能产生重要影响的SNP位点,为实验人员提供可靠的功能研究线索,也为长非编码RNA的临床应用提供指导。
搜索关键词: 长非编码RNA 生物学功能 功能研究 临床应用 重要影响 显著性 预测 线索 发现
【主权项】:
1.一种预测影响与RNA结合蛋白结合的长非编码RNA的功能的SNP位点的方法,包括如下步骤:(1)收集整理长非编码RNA数据,构建长非编码RNA数据集;(2)收集人类基因组SNP位点的注释数据,通过比较SNP位点和长非编码基因的基因组定位,识别位于长非编码基因区的SNP位点;将所述长非编码RNA数据集中的长非编码RNA序列上的所述SNP位点对应的碱基替换为突变后的碱基,构建得到SNP位点碱基突变后的长非编码RNA数据集;(3)收集RNA结合蛋白的注释数据,构建RNA结合蛋白的motif数据集;所述motif数据集中包括motif序列,所述motif序列为RNA结合蛋白能够特异识别的RNA序列;(4)基于极值分布对所述motif序列与所述长非编码RNA数据集中的每个长非编码RNA上的目标序列的相似程度进行评价,得到每个长非编码RNA打分最高的目标序列与所述motif序列相似程度的显著性水平p,并选择显著性水平p低于阈值的长非编码RNA作为SNP位点碱基突变前的所述RNA结合蛋白的靶标长非编码RNA;所述目标序列是指位于所述长非编码RNA序列上且与所述motif序列长度相等的RNA序列;假设某长非编码RNA序列长度为N;所述motif序列长度为L,那么在该长非编码RNA序列上就会得出(N‑L+1)个目标序列;(5)基于极值分布对所述motif序列与所述SNP位点碱基突变后的长非编码RNA数据集中的长非编码RNA上的目标序列的相似程度进行评价,得到每个长非编码RNA打分最高的目标序列与所述motif序列相似程度的显著性水平p,并选择相似程度的显著性水平低于阈值的长非编码RNA作为SNP位点碱基突变后的所述RNA结合蛋白的靶标长非编码RNA;(6)比较所述SNP位点碱基突变前的所述RNA结合蛋白的靶标长非编码RNA和所述SNP位点碱基突变后的所述RNA结合蛋白的靶标长非编码RNA,得到所述影响与RNA结合蛋白结合的长非编码RNA的功能的SNP位点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院生物物理研究所,未经中国科学院生物物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810122529.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top