[发明专利]基因疾病关联分析系统的构建方法、装置和计算机设备有效
申请号: | 201910662841.1 | 申请日: | 2019-07-22 |
公开(公告)号: | CN110534159B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 何昆仑;石金龙;尹成亮;贾志龙;于康;赵莉 | 申请(专利权)人: | 中国人民解放军总医院 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B45/00;G16B50/30;G16H50/70 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 金无量 |
地址: | 100036*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 疾病 关联 分析 系统 构建 方法 装置 计算机 设备 | ||
本发明涉及一种基因疾病关联分析系统的构建方法、装置、计算机设备和存储介质,所述方法包括:获取与每一种预设的疾病相关的基因数据;根据与每一种预设的疾病相关的基因数据,通过预训练的机器学习模型,构建与每一种预设的疾病对应的基因疾病数据表;根据与每一种预设的疾病对应的基因疾病数据表,构建基因疾病关联数据库;将基因疾病关联数据库进行图形化展示,以构建基因疾病关联分析系统。通过上述方法,可以构建一系统性、高质量的基因疾病关联分析系统,通过该系统,用户可以非常直观和便捷的根据某一类疾病的疾病名称或临床特征筛选出与该疾病相关联的候选基因,进而发现、识别某一类疾病在发生发展过程中的调控基因。
技术领域
本发明涉及生物信息学领域,特别是涉及一种可以用来展示多种预设的疾病与基因数据之间关联关系的基因疾病关联分析系统的构建方法、装置、计算机设备和存储介质。
背景技术
随着生物技术、计算机技术以及高通量技术的发展,各个领域积累了大量与疾病与基因相互关联的文献和数据。面对海量的数据,如何对其进行系统分析和深入挖掘成为了生命科学研究领域的研究热点。其中,深入挖局复杂疾病的关联基因成为一项在疾病相关研究中的重要挑战,对于临床诊治和研究疾病发病机理都具有重要的指导意义。
目前,我们只能通过人工检索的方式,在OMIM、ClinVar等基因知识库中去下载与疾病相关的基因数据,最后将下载的数据进行人工整理和分析,来总结疾病与基因之间的关联关系,这使得检索的效率十分低下且检索结果准确度不高,且经过人工整理和分析后的数据也存在数量少、质量差,价值低等问题。
发明内容
基于此,有必要针对上述问题,提供一种能够直观且全面的展示疾病与基因数据之间关联关系的基因疾病关联分析系统的构建方法、装置、计算机设备和存储介质。
一种基因疾病关联分析系统的构建方法,所述方法包括:
获取与每一种预设的疾病相关的基因数据;
根据与每一种预设的疾病相关的基因数据,通过预训练的机器学习模型,构建与每一种预设的疾病对应的基因疾病数据表;
根据与每一种预设的疾病对应的基因疾病数据表,构建基因疾病关联数据库;
将基因疾病关联数据库进行图形化展示,以构建基因疾病关联分析系统。
在其中一个实施例中,获取与每一种预设的疾病相关的基因数据,包括:
在基因知识库中获取疾病基因数据集数据,并对基因疾病数据集数据进行校验和预处理,得到基因数据;
对每一种预设的疾病的疾病名称进行模糊扩展,得到与每一种预设的疾病相关的特征词汇;
根据与每一种预设的疾病相关的特征词汇,在基因数据中筛选出与每一种预设的疾病对应的基因数据。
在其中一个实施例中,基因数据包括疾病名称、基因名称、基因ID、染色体定位、突变类型和突变频率中的一种或多种数据。
在其中一个实施例中,根据与每一种预设的疾病相关的基因数据,通过预训练的机器学习模型,构建与每一种预设的疾病对应的基因疾病数据表,包括:
根据与每一种预设的疾病相关的基因数据,通过加权模型计算出每一种预设的疾病对应的每一种基因的加权分数;
通过归一化模型,将每一种预设的疾病对应的每一种基因的加权分数做归一化处理,得到0至1范围内的归一化后的分数;
根据与每一种预设的疾病对应的每一种基因的基因名称和归一化后的分数,构建与每一种预设的疾病对应的基因疾病数据表。
在其中一个实施例中,加权模型满足如下关系式:
和
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军总医院,未经中国人民解放军总医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910662841.1/2.html,转载请声明来源钻瓜专利网。