[发明专利]一种基于快速网络嵌入的疾病基因预测方法有效
申请号: | 202010356861.9 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111540405B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 张宁芮;项炬;李敏;吕小毅;陈晨;严紫薇;陈程 | 申请(专利权)人: | 新疆大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/30;G06N20/00 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 孟阿妮;张小勇 |
地址: | 830000 新疆维吾尔*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 快速 网络 嵌入 疾病 基因 预测 方法 | ||
1.一种基于快速网络嵌入的疾病基因预测方法,其特征在于:其方法包括以下步骤:
步骤1:异构网络构建
通过集成四种类型的关联数据来构建异构网络,其中四种类型的关联数据包括疾病-基因、疾病-表型、蛋白质-蛋白质和基因-GO关联;
步骤2:快速网络嵌入
采用快速网络嵌入来学习网络中节点的低维向量表示,在快速网络嵌入算法中,网络嵌入时需要保持高阶邻接关系,将n个节点的网络邻接矩阵A的目标相似度函数Φ(A)∈Rn×n定义为网络邻接矩阵的多项式函数,假设Φ(A)是一个正的半定函数,它表示为:
Φ(A)=S·ST,
其中S=α0I+α1A1+α2A2+…+αpAp;α0,α1,α2,…,αp是预定义的权重,并且p是阶数;然后将目标相似度函数Φ(A)∈Rn×n分解为两个低维矩阵U,V∈Rn×d的乘积,其优化目标函数为其中n为节点数,d为嵌入维数,对于无向网络,A是对称矩阵,U=V,优化目标函数重写为:
为使该目标函数最小,采用高斯随机投影法,通过此方法得到嵌入U,
U=S·Q=(α0I+α1A+α2A2+...+αpAp)Q,
其中Q∈Rn×d服从高斯分布,即邻近矩阵S被随机投影到低维子空间;
将U分解成不同阶的矩阵U=α0U0+α1U1+α2U2+...+αpUp,其中
U0=Q,
步骤3:双层异构网络改造
采用步骤2中信息重建一个双层异构网络,通过以下方式计算疾病之间的余弦相似度,
其中表示节点i的嵌入向量,然后使用k-nearest(KNN)方法得到改进的疾病网络,采用相同的方法得到一个改进的基因网络,然后,将改进后的疾病网络、改进后的基因网络和疾病-基因关联网络进行整合,生成疾病与基因的双层异构网络,用以下符号表示:
其中MD表示改进的疾病网络;MG表示改进的基因网络;MA表示疾病-基因关联;表示MA的转置;在双层异构网络中,采用带重启的随机游走来计算疾病基因的得分,并根据得分对所有候选基因进行排序,得到每个疾病的预测基因列表;
步骤4:双层异构网络传播
在步骤3改造的双层异构网络中模拟一个网络传播--带重启的随机游走,给定疾病网络MD、基因网络MG和疾病-基因网络MA,定义以下对角线矩阵DD,DG和DA,其中对角线元素由(DD)i,i=∑j(MD)j,i,(DG)i,i=∑j(MG)j,i和(DA)i,i=∑j(MA)j,i定义,MD,MG和MA的归一化矩阵写为:
通过这些归一化矩阵,构造了一个新的矩阵,
其中β是层间跳跃概率,当随机游走者在疾病-疾病网络中时,它以概率β跳跃到基因-基因网络,也以概率1-β停留在原有的网络中;
定义一个对角矩阵并且并通过以下方法得到了双层异构网络中网络传播过程的最终转移矩阵,
具有重启的随机游动用下面的方程来描述,
pt+1=(1-α)T·pt+αp0,
其中是随机游走的初始概率向量;是疾病子网中的初始概率向量;是基因子网中的初始概率向量;参数α∈(0,1)是重新启动概率,表示随机游走者有概率α返回到种子节点,在几个步骤之后,概率达到稳定状态,根据稳定概率对基因进行排序,从而预测与疾病相关的基因。
2.根据权利要求1所述的一种基于快速网络嵌入的疾病基因预测方法,其特征在于:步骤2中,所采用的快速网络嵌入方法为迭代随机投影网络嵌入,迭代随机投影网络嵌入使用高斯随机投影方法将网络映射到低维嵌入空间,同时保持节点间的高阶邻近性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆大学,未经新疆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010356861.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摄像模组、电子设备及摄像方法
- 下一篇:一种电解次亚酸消毒水的生产装置