[发明专利]一种预测两种疾病共同致病基因的方法有效
申请号: | 201511024251.4 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105631244B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 宋月红;黄涛;蔡雷;陈文忠;贺林 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 致病基因 疾病 基因 预测 蛋白作用 蛋白 网络图 关键驱动 基于位置 随机游走 重叠基因 富集 网络 检验 医疗 应用 分析 | ||
1.一种预测两种疾病共同致病基因的方法,其特征在于,包括以下步骤:
S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;
S2:寻找上述两种疾病的致病基因对应的蛋白在所述蛋白网络中的位置;
S3:基于所述位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因;
所述步骤S1具体包括:分别选取两种疾病的已知致病基因作为种子基因集a和b,种子基因集a内包含疾病A的若干个种子基因,种子基因集b内包含疾病B的若干个种子基因;
所述步骤S2具体包括:根据两种疾病已知的蛋白作用网络绘制以所述种子基因集a和b为核心的蛋白作用网络图;
所述步骤S3具体包括:
S31:以每个所述种子基因为起点,在所述蛋白作用网络中进行基因扩展以得到扩展基因,并赋予每个所述扩展基因一个分值,所述分值与其所属的扩展基因对应的疾病相关性的强弱相关;
S32:将所述扩展基因依据分值大小进行由高到低的排序;
S33:从所述排序中的最大值开始依次计算每个扩展基因的加和,对任意一个扩展基因i,若其为种子基因集a中的种子基因扩展得到的,且其计算加和时,加和中包括任意一个种子基因集b的扩展基因,则对扩展基因i进行加分,加和中不包括任意一个种子基因集b的扩展基因,则对扩展基因i进行减分;
对任意一个扩展基因i,若其为种子基因集b中的种子基因扩展得到的,且其计算加和时,加和中包括任意一个种子基因集a的扩展基因,则对扩展基因i进行加分,加和中不包括任意一个种子基因集a的扩展基因,则对扩展基因i进行减分;
S34:依据分值的预设阈值分别选取加和后的两种疾病的扩展基因;
S35:选取步骤S34中得到的两种疾病的扩展基因中的重叠基因;
S36:对所述重叠基因进行筛选,得到两种疾病的共同致病基因。
2.根据权利要求1所述的预测两种疾病共同致病基因的方法,其特征在于,所述步骤S31中,采用重起始的随机游走方法在所述蛋白作用网络中进行基因扩展以得到扩展基因。
3.根据权利要求1所述的预测两种疾病共同致病基因的方法,其特征在于,设任意一个扩展基因j的分值为Vj,若j属于种子基因集a中的种子基因扩展得到的,则每次加和时,加分时得到的分值为
4.根据权利要求1所述的预测两种疾病共同致病基因的方法,其特征在于,所述步骤S33中计算每个扩展基因的加和时,采用基因集富集分析法进行计算。
5.根据权利要求1所述的预测两种疾病共同致病基因的方法,其特征在于,所述步骤S36中采用超几何学方法计算所述重叠基因及其在蛋白作用网络中相邻基因的p值,依据该p值对重叠基因进行筛选,其中,p值按下式计算:
N为蛋白作用网络图中所有蛋白/基因的数量,M是共同蛋白/基因数目,n是相邻蛋白/基因的数目,m是相邻蛋白/基因中共同蛋白/基因数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511024251.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带保护装置的碎纸机
- 下一篇:防咬蚊帐
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用