[发明专利]一种预测影响长非编码RNA生物学功能的SNP位点的方法有效
申请号: | 201810122529.9 | 申请日: | 2018-02-07 |
公开(公告)号: | CN108319818B | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 陈小伟;范珍;陈润生 | 申请(专利权)人: | 中国科学院生物物理研究所 |
主分类号: | G06F19/22 | 分类号: | G06F19/22;G06F19/20 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 关畅 |
地址: | 100101*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 长非编码RNA 生物学功能 功能研究 临床应用 重要影响 显著性 预测 线索 发现 | ||
本发明公开了一种预测影响长非编码RNA生物学功能的SNP位点的方法。本发明首先建立了长非编码RNA所包含的RNA结合蛋白能够识别的特异的motif序列的识别及显著性评价方法,然后基于此方法对位于这些特定序列中的SNP位点所产生的影响进行评价。利用此方法可以发现对长非编码RNA生物学功能产生重要影响的SNP位点,为实验人员提供可靠的功能研究线索,也为长非编码RNA的临床应用提供指导。
技术领域
本发明涉及分子生物学、功能基因组学和生物信息学领域,更具体涉及一种预测影响长非编码RNA生物学功能的SNP位点的方法。
背景技术
2001年人类基因组草图的发布是人类基因组计划成功的里程碑事件,开启了功能基因组研究的序幕。基因组中蕴含的大量基因和功能元件有待于进一步的识别和研究。2012年,DNA元件百科全书计划(ENCODE)公布了一批研究数据,数据显示人类基因上约75%的区域能够发生转录,而能够编码蛋白质的编码区只占人类基因组的不到3%,预示着人类基因组的转录产物中含有大量的未知的非编码RNA。早在1989年,文献中第一次报道了一种全新的非编码RNA----长非编码RNA。长非编码RNA(long noncoding RNA,lncRNA)是一类长度大于200个核苷酸并且不具有编码蛋白质能力的核糖核酸。由于受到当时技术条件的限制,长非编码RNA的发现和研究进展非常缓慢。随着高通量检测技术(例如基因芯片技术和高通量测序技术)的发展和进步,2007年文献首次报道长非编码RNA系统发现的工作,由此开始了长非编码RNA系统发现和研究的序幕。据GENCODE计划最新公布的数据,人类长非编码RNA的数目已达27,908条。根据长非编码RNA相对于附近蛋白编码基因所在的基因组位置关系,大致可以将其分为以下五类:外显子型lncRNA、内含子型lncRNA、反义型lncRNA、反向型lncRNA和基因间型lncRNA。
lncRNA的数量巨大超出了绝大多数科学家的预期,其生物学功能的研究逐渐成为生命科学研究的热点,经过近十年的研究积累,生物学家已经对lncRNA发挥生物学功能的作用机制有了初步的认识。首先,lncRNA可以作为诱饵通过与其他分子相结合,阻断其他分子与其靶标的结合,进而影响其他分子的原有功能。例如,lncRNA与mRNA竞争性结合miRNA,阻断了miRNA与mRNA的结合,进而间接影响了mRNA的表达。linc-RoR是一个长非编码RNA,能够跟胚胎干细胞分化相关核心转录因子Oct4、Sox2和Nanog竞争性结合miR-145,阻止miR-145对Oct4等基因的调控,linc-RoR与转录因子和miRNA共同构成了一个调控环路调控胚胎干细胞的状态;其次,lncRNA可以作为脚手架,将生物大分子关联起来形成复合物,例如长非编码RNA HOTAIR能够跟PRC2结合,同时又能跟LSD1/CoREST/REST复合物结合,PRC2具有组蛋白甲基转移酶活性,能够催化H3K27发生三甲基化,从而沉默基因的转录,而LSD1具有去甲基化酶的活性,能够催化H3K4去甲基化。HOTAIR作为脚手架分子将两种不同的染色质修饰复合物关联起来共同沉默基因的表达;第三,lncRNA作为向导,带领蛋白质复合物到特定的细胞位置行使功能。例如,受p53调控的长非编码RNA lincRNA-p21。lincRNA-p21能够抑制p53依赖的转录应答。lincRNA-p21能够跟hnRNP-K相互作用,进而把hnRNP-K引导到特定的基因组位置去抑制基因的表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院生物物理研究所,未经中国科学院生物物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810122529.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:循环肿瘤DNA重复序列的处理方法及装置
- 下一篇:非编码RNA的预测方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用