[发明专利]基于自注意力机制的长链非编码RNA-疾病关联预测方法和系统在审
申请号: | 202210818621.5 | 申请日: | 2022-07-12 |
公开(公告)号: | CN115171780A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 朱敏;周怡;王心翌;姚林 | 申请(专利权)人: | 四川大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G06N3/04;G06N3/08 |
代理公司: | 成都禾创知家知识产权代理有限公司 51284 | 代理人: | 刘凯 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 长链非 编码 rna 疾病 关联 预测 方法 系统 | ||
本发明公开了一种基于自注意力机制的长链非编码RNA‑疾病关联预测方法和系统,使用已经经过生物实验验证的长链非编码RNA‑疾病关联数据来训练深度学习模型,并使用所述模型预测目标长链非编码RNA‑疾病节点对的关联关系;在特征提取阶段,本发明基于已知关联和相似性信息构建异质网络的带权邻接矩阵,并进一步提取其中的多跳拓扑通路特征;在模型阶段,本发明使用自注意力机制构建预测模型,赋予关键拓扑通路更高的权重以使网络充分学习关键特征,进而提升模型的预测精度;最后,在基准数据集上对本发明提出的方法进行评价,在预测精度方面优于现有技术。
技术领域
本发明涉及生物信息技术领域,具体涉及一种基于自注意力机制的长链非编码RNA-疾病关联预测方法和系统。
背景技术
长链非编码RNA是一种长度大于200个核苷酸的非编码RNA。作为生物体内重要的调控因子,长链非编码RNA参与了许多关键的基因调控过程,与多种人类疾病的发生和发展密切相关。例如,膀胱癌的凋亡相关转录物(AATBC)通过调节桥粒相关蛋白(Pinin)促进鼻咽癌的转移。
近年来,已有部分长链非编码RNA-疾病关联关系得到了生物湿实验验证。但是高昂的时间和资源成本大大限制了生物湿实验方法的进一步发展。基于已知的实验数据,研究人员越来越多地利用计算方法预测长链非编码RNA-疾病关联关系,从而为生物湿实验验证提供可靠的指导。
根据预测模型所使用的技术的类别,可以将该领域现有的计算方法分为两类:基于传统机器学习的预测方法与基于深度学习的预测方法。基于传统机器学习的预测方法较早地被应用于长链非编码RNA-疾病关联分析,通过矩阵运算、网络传播和分类器算法,实现特征提取和二分类预测。深度学习具有强大的非线性拟合能力,是当前计算方法构建模型的首要选择。相较于机器学习,基于深度学习的预测方法在结构上更加灵活,可以端到端地实现低维特征嵌入表示和分类预测,从而提高模型的预测准确性。
但现有基于深度学习的长链非编码RNA-疾病关联预测方法仍存在一些不足之处。基于深度学习的预测方法的处理流程可划分为特征提取阶段和模型阶段。在特征提取阶段,当前的编码方式将已知的长链非编码RNA和疾病关联情况整合为异质网络,并针对同类型节点计算类内相似性。但是仅提取预测目标之间的两跳信息,忽略了网络中潜在的拓扑关系,未能表示预测目标之间的多跳通路信息。在模型阶段,现有模型多采用多层感知机(MLP)、卷积神经网络(CNN)与图神经网络(GNN)相结合的方式,但存在模型结构复杂、混淆特征语义的问题,因此预测精度仍有待进一步提高。
发明内容
针对上述问题,本发明的目的在于提供一种基于自注意力机制的长链非编码RNA-疾病关联预测方法和系统,提取异质网络中的多跳拓扑通路特征,并从全局的角度聚焦拓扑通路之间的相互依赖关系,进而提高模型的预测精度。技术方案如下:
一种基于自注意力机制的长链非编码RNA-疾病关联预测方法,包括如下步骤:
S1:数据获取与预处理:获取疾病语义信息和已知的长链非编码RNA-疾病关联情况,构建异质网络,并计算同质节点彼此间的相似性;
S2:拓扑特征提取:将所述相似性和关联情况表示为异质网络的带权邻接矩阵,根据所述邻接矩阵幂次的定义,获取目标长链非编码RNA-疾病节点对之间的多跳拓扑通路特征;
S3:基于自注意力网络预测关联关系:构建基于自注意力机制的神经网络,获取特征嵌入并通过单层全连接网络进行分类,将基于自注意力机制的神经网络的输出矩阵转换为概率分布,预测是否具有关联关系;
S4:模型训练:在训练集上基于反向传播算法进行模型训练,得到长链非编码RNA-疾病关联预测模型;
S5:预测关联关系:通过预测模型处理目标长链非编码RNA-疾病节点对,判断是否具有关联关系。
进一步的,所述步骤S1具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210818621.5/2.html,转载请声明来源钻瓜专利网。