[发明专利]一种预测LncRNA和环境因素关联关系的方法有效
申请号: | 201810209311.7 | 申请日: | 2018-03-14 |
公开(公告)号: | CN108427865B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 周杰;徐展良 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B50/30;G16B20/00 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 预测 lncrna 环境 因素 关联 关系 方法 | ||
本发明公开了一种预测LncRNA和环境因素关联关系的方法,包括:S1、根据已知的LncRNA‑环境因素关联关系网络的邻接矩阵,分别计算出LncRNA的高斯相互作用属性核相似矩阵KL和环境因素的高斯相互作用属性核相似矩阵KE;S2、把KL和KE通过拉普拉斯算子进行归一化;S3、在LncRNA空间和环境因素空间中分别定义成本函数,通过最小化该成本函数,分别得到LncRNA空间和环境因素空间的最优分类器;S4、将得到的两种最优分类器转化为统一空间的分类器,用于计算LncRNA‑环境因素关联关系的概率,根据概率对LncRNA‑环境因素关联关系进行排名,概率值越高说明该LncRNA‑环境因素的关联关系越强。所述方法有效解决了生物实验方法的盲目性、成本高问题,对生物学家的实验研究起到了指导的作用。
技术领域
本发明涉及生物信息学领域,具体涉及一种预测LncRNA和环境因素关联关系的方法。
背景技术
生物个体的先天本性和后天发展出来的行为习惯的不同主要是由遗传和环境的差异造成的。生物学家普遍认为,表型变异不是单纯由遗传或环境的差异产生,而是由两者的相互作用共同影响的;表型和疾病是由遗传因素(genetic factors,GFs)和环境因素(environmental factors,EFs)的复杂相互作用决定的。如今人们普遍认为,几乎所有的疾病都是由个体的遗传因子与其环境暴露之间复杂的相互作用引起的。例如,癌症、心脏病、阿尔茨海默病和糖尿病等人类疾病均是由GFs和EFs之间复杂的相互作用引起的。
根据分子生物学的中心法则,遗传信息主要存储于DNA序列中。遗传信息从DNA转录成RNA,再从RNA翻译成蛋白质。RNA是DNA序列与其编码蛋白质之间的中间体。基因组序列分析表明,人类基因组中,编码蛋白质的序列占DNA序列的比例不到2%,其余约98%的DNA序列都不编码蛋白质。因此,由DNA转录的RNA中,绝大多数为不编码蛋白质的RNA。生物学中将不编码蛋白质的RNA称为非编码RNA(non-coding RNAs,ncRNAs)。在ncRNA中,长度在200-100000nt之间的ncRNA分子被称为长非编码RNA(Long non-coding RNA,LncRNA)。LncRNA占总RNA的比例可达4%-9%。分子生物学研究表明,LncRNA占总RNA的比例随着生物体复杂性的增加而增加。作为ncRNAs的一个重要子集,LncRNAs最近被确定为最大的具有显著多样化的RNA家族之一,并且已经成为不同物种基因组信息的重要组成部分。近年研究表明,LncRNA参与了X染色体沉默、染色体修饰和基因组修饰、转录激活、转录干扰、核内运输等过程,同时在细胞增殖分化、染色质重塑、表观遗传调控、基因组剪接、转录、翻译等许多重要生物过程中发挥着至关重要的作用。LncRNA是一类重要的调控生命过程的ncRNA,它在多层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达。LncRNA被认为主要参与mRNA调控,并参与调节发育和疾病。在某些疾病中LncRNAs也被确定为药物靶点或预后因素。然而,由于LncRNA的调控网络复杂,其调控的潜在机制仍然不清楚。大多数LncRNAs的功能仍然未知,需要进一步的探索研究。
然而,与基因和miRNA相比,利用生物信息学方法以及计算方法研究与疾病有关的LncRNA和EFs之间的关联关系却相对较少。Zhou等人设计了RWREFD(基于重启随机游走模型的LncRNA-EF关联关系预测模型)预测与疾病相关的LncRNA-EFs关联关系并开发了一个LncRNA-EFs关联关系数据库:LncEnvironmentDB,这是一个基于Web的数据库,旨在为LncRNA和EF提供全面的资源平台。Zhou和Shi设计了一个基于二分网络和资源转移的方法来预测LncRNA-EFs的关联关系,预测的结果覆盖了更多被实验证实的LncRNA-EFs的关联关系。存储LncRNA-EFs关联关系数据库已经被建立起来,越来越多LncRNA和环境因素的联系被实验所证实,因此,基于这些可用的生物数据发明有效的计算方法来预测潜在的LncRNA和环境因素之间的联系就显得非常重要。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810209311.7/2.html,转载请声明来源钻瓜专利网。