[发明专利]基因疾病关联分析系统的构建方法、装置和计算机设备有效
申请号: | 201910662841.1 | 申请日: | 2019-07-22 |
公开(公告)号: | CN110534159B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 何昆仑;石金龙;尹成亮;贾志龙;于康;赵莉 | 申请(专利权)人: | 中国人民解放军总医院 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B45/00;G16B50/30;G16H50/70 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 金无量 |
地址: | 100036*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 疾病 关联 分析 系统 构建 方法 装置 计算机 设备 | ||
1.一种基因疾病关联分析系统的构建方法,其特征在于,所述基因疾病关联分析系统用于展示至少一种预设的疾病与基因数据之间的关联关系,所述方法包括:
获取与每一种预设的疾病相关的基因数据以及特征词汇;
根据所述与每一种预设的疾病相关的基因数据以及特征词汇,通过预训练的机器学习模型确定出所述与每一种预设的疾病相关的基因数据在所述特征词汇中的加权分数,根据所述与每一种预设的疾病相关的基因数据对应的基因名称以及所述加权分数构建与所述每一种预设的疾病对应的基因疾病数据表;
根据所述与每一种预设的疾病对应的基因疾病数据表,构建基因疾病关联数据库;
将所述基因疾病关联数据库进行图形化展示,以构建所述基因疾病关联分析系统;
其中,所述预训练的机器学习模型包括加权模型,所述加权模型满足如下关系式:
和;
其中,是一种预设的疾病对应的一种基因在一个特征词汇中的加权分数,k为所述特征词汇的序列号;是所述预设的疾病与所述基因在一项基因数据中的相关度值;是所述基因数据的可靠度值;i为所述基因数据的序列号;是所述特征词汇对应的基因数据的数量;是一种预设的疾病对应的一种基因的加权分数。
2.根据权利要求1所述的基因疾病关联分析系统的构建方法,其特征在于,所述获取与每一种预设的疾病相关的基因数据以及特征词汇,包括:
在基因知识库中获取疾病基因数据集数据,并对所述基因疾病数据集数据进行校验和预处理,得到基因数据;
对所述每一种预设的疾病的疾病名称进行模糊扩展,得到与所述每一种预设的疾病相关的特征词汇;
根据所述与每一种预设的疾病相关的特征词汇,在基因数据中筛选出与所述每一种预设的疾病对应的基因数据。
3.根据权利要求1或2所述的基因疾病关联分析系统的构建方法,其特征在于,所述基因数据包括疾病名称、基因名称、基因ID、染色体定位、突变类型和突变频率中的一种或多种数据。
4.根据权利要求1所述的基因疾病关联分析系统的构建方法,其特征在于,所述根据所述与每一种预设的疾病相关的基因数据对应的基因名称以及所述加权分数构建与所述每一种预设的疾病对应的基因疾病数据表,包括:
通过归一化模型,将所述每一种预设的疾病对应的每一种基因在所述特征词汇中的加权分数做归一化处理,得到0至1范围内的归一化后的分数;
根据所述与每一种预设的疾病对应的每一种基因的基因名称和归一化后的分数,构建与所述每一种预设的疾病对应的基因疾病数据表。
5.根据权利要求4所述的基因疾病关联分析系统的构建方法,其特征在于,所述归一化模型满足如下关系式:
,
其中,是一种预设的疾病对应的一种基因的加权分数;是所述预设的疾病对应的每一种基因的加权分数中的最大值;是所述预设的疾病对应的所述基因的加权分数归一化后的分数。
6.根据权利要求1所述的基因疾病关联分析系统的构建方法,其特征在于,所述根据所述与每一种预设的疾病对应的基因疾病数据表,构建基因疾病关联数据库,包括:
根据所述与每一种预设的疾病对应的基因疾病数据表,通过疾病检索工具计算出每一种预设的疾病对应的每一种基因与所述预设的疾病之间的关联值;
根据每一种预设的疾病对应的每一种基因与所述预设的疾病之间的关联值,构建与所述每一种预设的疾病对应的基因疾病关联信息表;
根据所述与每一种预设的疾病对应的基因疾病关联信息表,构建所述基因疾病关联数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军总医院,未经中国人民解放军总医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910662841.1/1.html,转载请声明来源钻瓜专利网。