[发明专利]一种预测两种疾病共同致病基因的方法有效
申请号: | 201511024251.4 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105631244B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 宋月红;黄涛;蔡雷;陈文忠;贺林 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 致病基因 疾病 基因 预测 蛋白作用 蛋白 网络图 关键驱动 基于位置 随机游走 重叠基因 富集 网络 检验 医疗 应用 分析 | ||
本发明提供了一种预测两种疾病共同致病基因的方法,包括以下步骤:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;寻找上述两种疾病的致病基因对应的蛋白在蛋白网络中的位置;基于位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因。该方法通过在两种疾病的基因对应的蛋白作用网络图中进行基因扩展,并在扩展基因中的共同基因中选取两种疾病的共同致病基因,并在预测过程中应用了随机游走方法、基因集富集分析法及超几何检验法,使得共同致病基因的选取更加准确。本发明方法能够预测可能影响到两种疾病的关键驱动基因,可实现精准医疗。
技术领域
本发明涉及致病基因预测技术领域,特别涉及一种预测两种疾病共同致病基因的方法。
背景技术
目前在疾病治疗及预测领域,有些病患会同时患有一种以上的疾病,这种情况会带给患者极大痛苦,现代精准医学提出疾病诊断和治疗需要了解疾病的遗传物质基础,以开展针对个体遗传差异的诊断和治疗。但现实当中某两种特定的疾病发生在某个个体上的几率是比较低的,而一旦发生带来的疾病负担又是非常重的,例如有研究发现精神分裂症病人患结核病的比率为1.33~2.30%,与2010年第五次全国结核病流调抽样调查报告的普通人群中活动性结核病的患病率459/10万比较,精神分裂症患者这一特殊群体,结核病的患病率为普通人群的2.9~5.5倍。所以如何找到一种方法,能够预测两种疾病的共同致病基因,实现精准医疗,就显得非常关键。
现有技术中进行研究两种疾病的共同致病基因的方法主要有:1、基于相互作用网络的致病基因预测方法;2、基于PPI网络的疾病候选基因排名方法;3、基于协同过滤的疾病基因预测方法;4、基于复杂网络的症状基因预测方法等等。这些方法均属于以因果关系推理的方式进行预测的,因而这些方法存在天然的偏倚,且依赖临床病例,推广难度较大。
发明内容
本发明的目的在于提供一种预测两种疾病共同致病基因的方法,以解决现有技术由于以因果关系推理的方式进行预测所造成的存在偏倚且依赖临床数据推广难度大的问题。
本发明的第二目的在于提供一种预测两种疾病共同致病基因的方法,以实现找到两种疾病共同的致病遗传物质基础的目标。
为实现上述目的,本发明提供了一种预测两种疾病共同致病基因的方法,包括以下步骤:
S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;
S2:寻找上述两种疾病的致病基因对应的蛋白在所述蛋白网络中的位置;
S3:基于所述位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因。
较佳地,所述步骤S1具体包括:分别选取两种疾病的已知致病基因作为种子基因集a和b,种子基因集a内包含若干个疾病A的种子基因,种子基因集b内包含若干个疾病B的种子基因;
所述步骤S2具体包括:根据两种疾病已知的蛋白作用网络绘制以所述种子基因集a和b为核心的蛋白作用网络图;
所述步骤S3具体包括:
S31:以每个所述种子基因为起点,在所述蛋白作用网络中进行基因扩展以得到扩展基因,并赋予每个所述扩展基因一个分值,所述分值与其所属的扩展基因对应的疾病相关性的强弱相关;
S32:将所述扩展基因依据分值大小进行由高到低的排序;
S33:从所述排序中的最大值开始依次计算每个扩展基因的加和,如对任意一个扩展基因i,其为种子基因集a中的种子基因扩展得到的,且其计算加和时,加和中包括任意一个种子基因集b的扩展基因,则对扩展基因i进行加分,否则减分;
S34:依据分值的预设阈值分别选取加和后的两种疾病的扩展基因;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511024251.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带保护装置的碎纸机
- 下一篇:防咬蚊帐
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用