[发明专利]基于深度学习的非编码RNA与疾病之间关联的预测方法有效
申请号: | 201810833752.4 | 申请日: | 2018-07-26 |
公开(公告)号: | CN109147936B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 刘滨;魏航 | 申请(专利权)人: | 刘滨 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06N3/04;G16B40/00 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 胡吉科 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 编码 rna 疾病 之间 关联 预测 方法 | ||
本发明提供了一种基于深度学习的非编码RNA与疾病之间关联的预测方法,分别从多个层次度量非编码RNA,疾病的相似性,在构造非编码RNA与疾病关联的特征时,不同于现有方法,本发明考虑了可能影响其关联程度的三个因素:所有非编码RNA相似信息,所有疾病相似信息,以及已知非编码RNA和疾病的关联信息,充分利用三者信息量化目标关联对的特征,解决了已有技术在构造关联对特征时,忽略重要的已知关联信息问题。并且在多角度的特征融合过程中,本发明利用深度学习卷积神经网络整合提取非编码RNA和疾病的高层关联特征,克服了已有技术以初始特征数据为中心,忽视特征数据与关联程度信息的缺陷。
技术领域
本发明涉及生物信息学技术领域,尤其涉及一种基于深度学习的非编码RNA与疾病之间关联的预测方法。
背景技术
非编码RNA在细胞发育,细胞分化,信号传导等多个生命活动过程中发挥着关键作用,其与疾病的发生、发展和治疗关联密切,利用已知的生物实验知识来预测多个非编码RNA与疾病的关联,对疾病的病理理解和治疗具有重要的研究意义。
基于机器学习的方法是目前重要的一种非编码RNA与疾病的关联预测技术。首先,利用常规的序列比对方法,高斯核交互谱统计等方法来计算非编码RNA之间的功能相似性,利用疾病的语义信息,或疾病与其关联的分子交互等信息来计算多种疾病之间的相似性。然后利用多核融合方法对多个角度的相似特征进行整合。针对已知关联的非编码RNA与疾病,将其与所有的非编码RNA和疾病相似性进行拼接,从而构建关联特征。利用训练样本对分类器的参数进行学习,最终利用学习得到的模型对未知关联的非编码RNA和疾病的关联程度进行预测。
提取非编码RNA和疾病的关联特征是后续模型预测的关键一步。现有的基于机器学习方法在构造非编码RNA与疾病的关联特征时,考虑整合多个角度量化的非编码RNA之间、疾病之间的相似信息,针对一个非编码RNA和疾病关联对,将非编码RNA间相似特征和疾病相似特征进行拼接得到最终的关联对特征。然而,事实上,影响非编码RNA和疾病关联的因素不仅仅是预测未知关联对与其他非编码RNA和疾病的相似程度,其他非编码RNA和疾病之间的关联程度对未知关联对的关联预测也起着重要作用。现有基于机器学习的预测方法,在构建未知关联对的关联特征时,没有考虑到其他非编码RNA与疾病的关联信息,未能较好的利用已知分子与疾病的交互信息。
随着生物分子信息的不断积累,促使量化分子间,疾病间的相似性方法逐渐增多。现有基于机器学习的非编码RNA和疾病预测方法常规采用多核融合方法对多角度量化的非编码RNA相似特征,疾病相似特征进行整合。然而,多核数据融合方法旨在对原始数据进行核变化,整合多个层次数据得到系统的相似特征。此多核融合过程仅对原始数值进行线性或非线性约束变换,并未考虑到数据本身特征对最终关联预测结果的贡献价值,导致融合特征过程中噪音数据的保留,以及可能有用信息的丢失,从而影响了预测关联结果的有效性和准确性。
发明内容
为了解决现有技术中的问题,本发明提供了一种基于深度学习的非编码RNA与疾病之间关联的预测方法,本发明具体通过如下技术方案实现:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘滨,未经刘滨许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810833752.4/2.html,转载请声明来源钻瓜专利网。