[发明专利]一种基因合成致死关联预测方法有效
申请号: | 202010511252.6 | 申请日: | 2020-06-08 |
公开(公告)号: | CN111863123B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 欧阳乐;林奕龙 | 申请(专利权)人: | 深圳大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;G16B50/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 张金福 |
地址: | 518060 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基因 合成 致死 关联 预测 方法 | ||
本发明涉及一种基因合成致死关联预测方法,包括:S1:确定并使用多标签学习损失函数;S2:对多标签学习损失函数设置图正则化惩罚项;得到图正则化多标签学习模型;S3:利用多视角信息重新构建S2中的图正则化多标签学习模型,确定自适应加权多视角模型;S4:对自适应多视角模型进行求解,实现基因合成致死关联的预测。本发明所述方法可用于融入多个视角数据,打破单个视角的局限,具备较高的灵活性,可提高基因合成致死关联预测的准确率。
技术领域
本发明涉及计算机生物学领域,更具体地,涉及一种基因合成致死关联预测方法。
背景技术
癌症是由基因缺陷引起的复杂疾病。因此,揭示基因之间的相互作用关系对癌症的诊断、治疗和药物开发至关重要。两个基因合成致死是指两个基因都同时失活对细胞是致命的,但其中一个基因的失活对细胞不会造成影响。因此,挖掘基因合成致死关联有利于发现新的抗癌药物靶点,对癌症的治疗意义重大。近年来,很多研究人员利用生物实验手段对基因合成致死展开了研究。然而,基于生物实验方法的基因合成致死关联识别仍面临诸多挑战,如高成本,脱靶效应以及平台或细胞系之间的低一致性等。因此,需要先借助计算方法筛选出潜在的基因合成致死关联,再通过生物实验进一步验证。
近年来,涌现了许多基于计算模型的基因合成致死关联预测方法,根据模型的基本原理,可以大致地将现有的方法分为三类,即基于知识的方法、监督机器学习方法和矩阵分解方法。虽然每种算法都有各自的特点,它们通常只能够利用到网络中某种特定的拓扑结构。例如,基于知识的方法利用已有的合成致死基因的知识或假设来预测潜在的基因合成致死关联,然而,该方法严重依赖于其它基因组数据,并且没有利用已知的基因合成致死关联中隐含的信息。监督机器学习方法利用已知的基因合成致死关联建立分类模型,用于预测新的基因合成致死关联,但是传统的监督机器学习方法既需要正例,也需要负例,然而基因合成致死关联数据中通常只有正例,因此,在基因合成致死关联预测方面,该模型具有一定的局限性。矩阵分解方法将基因合成致死关联预测问题转化为矩阵填充问题,进而通过矩阵分解来进行填充,但是矩阵分解方法的性能依赖于对潜变量空间维数的假设,而真实维数通常是未知的,并且很难确定。由此可见,现有的计算方法通常缺乏足够的已知基因合成致死关联数据进行训练,并且难以有效利用已知合成致死基因的相关知识,加上原始数据的固有噪声,导致其难以取得较高的预测准确率。
发明内容
本发明为克服上述现有技术所述的基因合成致死关联预测准确率不够高的缺陷,提供一种基因合成致死关联预测方法。
所述方法包括以下步骤:
S1:确定并使用多标签学习损失函数;
S2:对多标签学习损失函数设置图正则化惩罚项;得到图正则化多标签学习模型;
S3:利用多视角信息重新构建S2中的图正则化多标签学习模型,确定自适应加权多视角模型;
S4:对自适应加权多视角模型进行求解,实现基因合成致死关联的预测。
本发明的目的是为了从不同来源得到的基因相似信息中提取有用的信息,并且产生一个更为准确和可靠的基因相似矩阵,通过图正则化项将学习得到的基因相似矩阵整合到基因合成致死的预测中,进而挖掘出更为准确和可靠的新的基因合成致死对,该方法可用于融入多个视角数据,打破单个视角的局限,具备较高的灵活性。
优选地,S1所述损失函数为:
其中,U为预测的基因合成致死关联矩阵,矩阵中每个元素Uij的数值表示基因gi和基因gj形成合成致死关联的可能性,数值越大表明越可能形成致死关联;Y∈{0,1}n×n描述已知的基因合成致死关联,n为基因的数目;Tr(·)表示矩阵的迹。
优选地,S2中图正则化多标签学习模型为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010511252.6/2.html,转载请声明来源钻瓜专利网。