[发明专利]一种预测两种疾病共同致病基因的方法有效
申请号: | 201511024251.4 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105631244B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 宋月红;黄涛;蔡雷;陈文忠;贺林 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种预测两种疾病共同致病基因的方法,包括以下步骤:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;寻找上述两种疾病的致病基因对应的蛋白在蛋白网络中的位置;基于位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因。该方法通过在两种疾病的基因对应的蛋白作用网络图中进行基因扩展,并在扩展基因中的共同基因中选取两种疾病的共同致病基因,并在预测过程中应用了随机游走方法、基因集富集分析法及超几何检验法,使得共同致病基因的选取更加准确。本发明方法能够预测可能影响到两种疾病的关键驱动基因,可实现精准医疗。 | ||
搜索关键词: | 致病基因 疾病 基因 预测 蛋白作用 蛋白 网络图 关键驱动 基于位置 随机游走 重叠基因 富集 网络 检验 医疗 应用 分析 | ||
【主权项】:
1.一种预测两种疾病共同致病基因的方法,其特征在于,包括以下步骤:S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;S2:寻找上述两种疾病的致病基因对应的蛋白在所述蛋白网络中的位置;S3:基于所述位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因;所述步骤S1具体包括:分别选取两种疾病的已知致病基因作为种子基因集a和b,种子基因集a内包含疾病A的若干个种子基因,种子基因集b内包含疾病B的若干个种子基因;所述步骤S2具体包括:根据两种疾病已知的蛋白作用网络绘制以所述种子基因集a和b为核心的蛋白作用网络图;所述步骤S3具体包括:S31:以每个所述种子基因为起点,在所述蛋白作用网络中进行基因扩展以得到扩展基因,并赋予每个所述扩展基因一个分值,所述分值与其所属的扩展基因对应的疾病相关性的强弱相关;S32:将所述扩展基因依据分值大小进行由高到低的排序;S33:从所述排序中的最大值开始依次计算每个扩展基因的加和,对任意一个扩展基因i,若其为种子基因集a中的种子基因扩展得到的,且其计算加和时,加和中包括任意一个种子基因集b的扩展基因,则对扩展基因i进行加分,加和中不包括任意一个种子基因集b的扩展基因,则对扩展基因i进行减分;对任意一个扩展基因i,若其为种子基因集b中的种子基因扩展得到的,且其计算加和时,加和中包括任意一个种子基因集a的扩展基因,则对扩展基因i进行加分,加和中不包括任意一个种子基因集a的扩展基因,则对扩展基因i进行减分;S34:依据分值的预设阈值分别选取加和后的两种疾病的扩展基因;S35:选取步骤S34中得到的两种疾病的扩展基因中的重叠基因;S36:对所述重叠基因进行筛选,得到两种疾病的共同致病基因。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201511024251.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种带保护装置的碎纸机
- 下一篇:防咬蚊帐
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用