[发明专利]一种基于深度学习的双神经网络结构预测lncRNA-蛋白质相互作用方法有效
申请号: | 202110592443.4 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113313167B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 彭利红;王畅;周立前;田雄飞 | 申请(专利权)人: | 湖南工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G16B5/00;G16B40/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 杨千寻;杜梅花 |
地址: | 412000 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 神经网络 结构 预测 lncrna 蛋白质 相互作用 方法 | ||
本发明涉及一种基于深度学习的双神经网络结构预测lncRNA-蛋白质相互作用方法。首先,LPI特征提取:先获取已知的lncRNA序列、蛋白质序列,分别用Pyfeat和BioTriangle提取lncRNA和蛋白质的特征;然后,特征降维:基于主成分分析(PCA)分别对lncRNA和蛋白质原始特征进行降维,在降维之后将这些特征连接成一个向量;其次,建立LPI预测框架模型:建立由FIR网络和MLP网络组成的双神经网络结构的深度学习模型;最后,利用双神经网络结构对未知lncRNA‑蛋白质对进行分类。本发明比利用实验手段探测大规模的lncRNA‑蛋白质交互作用耗时更少,费用更低,可以实现对多个数据集进行训练和测试,预测偏差小,预测性能好,预测结果准确,并可以用于寻找新的lncRNA‑蛋白质关联对。
技术领域
本发明属于系统生物信息学领域,涉及一种基于深度学习的双神经网络结构预测lncRNA-蛋白质相互作用方法。
背景技术
在过去的几十年里,对多个基因组分析研究表明非编码调控元件控制着复杂有机体的发育过程。非编码元件通常会转录为非编码RNA(ncRNA),表明了ncRNA在生物体中的重要调控作用,研究表明,ncRNA可以调节许多生物学活动,这些活动对发育、分化和新陈代谢有着重要影响。而长度大于200个核苷酸的非编码RNA被称为长链非编码RNA(Long non-coding RNA,lncRNA),而lncRNA通过与RNA结合蛋白结合在调节细胞分化过程中发挥作用进而影响基因表达,lncRNA在一些复杂疾病(如癌症、神经系统疾病等)的具有促进或抑制的作用。
而现有技术(专利公布号:201610915233.3)下的一种基于双向随机游走和多标签学习的miRNA-环境因子关系预测方法,具体步骤包括:
1)首先基于已知的miRNA-环境因子关系,构建miRNA-环境因子矩阵ME;然后计算miRNA相似性和环境因子相似性,构建miRNA相似性矩阵和环境因子相似性矩阵;
2)根据miRNA相似性矩阵和环境因子相似性矩阵分别构建miRNA相似性网络和环境因子相似性网络;再基于miRNA相似性网络、环境因子相似性网络和miRNA-环境因子矩阵,构建miRNA-环境因子关系网络;
3)采用双向随机游走和多标签学习方法(Multi-label learning,MLL)来预测潜在的miRNA-环境因子关系:
a)对于miRNA和环境因子都是已知的情况,采用双向随机游走方法,分别在miRNA相似性网络和环境因子相似网络上进行不同步数游走,得到miRNA-环境因子得分矩阵,分值越大表明对应的miRNA和环境因子存在关系的可能性越大;
b)对于新的miRNA,基于miRNA的相似性网络和环境因子的相似性网络,采用多标签学习方法,得到新的miRNA与环境因子之间存在关系的概率值,概率值越大,两者存在关系的可能性越大;
c)对于新的环境因子,基于miRNA的相似性网络和环境因子的相似性网络,采用多标签学习方法,得到新的环境因子与miRNA之间存在关系的概率值,概率值越大,两者存在关系的可能性越大。
机器学习算法(如随机森林、支持向量机和贝叶斯网络)已被广泛应用在分析和提取生物医学数据中,机器学习方法通过训练数据建立最佳拟合模型来进行预测。深度学习作为机器学习的一个分支,也被生物信息学领域所青睐。深度学习克服了一般机器学习的许多局限,推动了生物信息学等各个领域的重大进步。
由于lncRNA和蛋白质具有许多生物学特性,有的特征对预测LPI并无帮助,而这些无关特性会导致维度灾难。在机器学习方法中,通常会先选择最优特征子集,然后再利用这些子集进行模型的训练和预测,特征选择方法提供了一种方法来去除冗余信息,获得对预测结果最有帮助的特征,从而通过提取重要特征来减少计算时间并提高性能来构造更好的分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工业大学,未经湖南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110592443.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:血管结扎装置
- 下一篇:碳酸盐岩溶蚀-冲剪交互作用试验系统及测试方法