[发明专利]一种利用多模态风险因素推断癌症风险概率的系统在审
申请号: | 202110700737.4 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113539493A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 杜登斌;杜小军;杜乐 | 申请(专利权)人: | 吾征智能技术(北京)有限公司 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70;G06F17/18;G06K9/62 |
代理公司: | 武汉红观专利代理事务所(普通合伙) 42247 | 代理人: | 王昌亮 |
地址: | 100000 北京市海淀区西三旗沁春*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 多模态 风险 因素 推断 癌症 概率 系统 | ||
本发明公开一种利用多模态风险因素推断癌症风险概率的系统,所述系统包括:数据收集模块:用于获取各类癌症高危人群的风险特征数据集和影响各类癌症发病的主要危险因素的数据集,组成多模态数据集;特征提取模块:用于对多模态数据集进行预处理,对预处理后的各种模态数据集分别进行风险特征提取;特征融合模块:确定归一化互信息的多模态融合方式,得到融合特征参数;模型建立模块:使用Logistic回归分析的方法,建立风险评估模型;风险评估模块:通过所述风险评估模型推断各类癌症风险概率。本发明通过构建癌症高危人群的癌症发病危险因素的风险评估模型,实现了基于跨模态融合的癌症风险自动评估和癌症早期风险的量化表示。
技术领域
本发明属于疾病预测领域,具体涉及一种利用多模态风险因素推断癌症风 险概率的系统。
背景技术
不同于传染病的发生有确定的病因,癌症的发病因素多样且常常是复杂综 合作用,多数癌症预防十分困难,癌症风险难以量化,特别是不同肿瘤早筛的 预警程度不同,因此应该因病而异,制定相应的筛查指标,建立科学评估体系 和风险认知指标十分重要。
发明内容
有鉴于此,本发明提出了一种利用多模态风险因素推断癌症风险概率的系 统,用于解决癌症早期风险无法有效量化表示的问题。
本发明第一方面,公开一种利用多模态风险因素推断癌症风险概率的系统, 所述系统包括:
数据收集模块:用于获取各类癌症高危人群的风险特征数据集和影响各类 癌症发病的主要危险因素的数据集,组成多模态数据集;
特征提取模块:用于对多模态数据集进行预处理,对预处理后的各种模态 数据集分别进行风险特征提取;
特征融合模块:确定归一化互信息的多模态融合方式,得到融合特征参数;
模型建立模块:使用Logistic回归分析的方法,建立风险评估模型;
风险评估模块:通过所述风险评估模型推断各类癌症风险概率。
优选的,所述多模态数据集中的数据类型包括文本型数据、图片型数据、 数值型数据。
优选的,所述确定归一化互信息的多模态融合方式,得到融合特征参数之 前还包括:
通过宽度学习系统得到各个模态数据集的宽度学习特征映射,宽度学习系 统包括数据输入层、特征映射层、权重学习层和预测输出层。
优选的,所述宽度学习系统中,特征映射层用于:
将输入的特征数据X随机映射到一组特征节点;
将特征节点随机映射到一组增强节点;
根据特征节点和增强节点得到单个模态数据集的宽度学习特征映射;
计算出所有模态数据集的宽度特征映射,得到增强节点映射条件下的特征 节点作为各个模态数据集的宽度学习特征映射
优选的,所述多模态融合方式具体为:
对于每一个模态的特征数据,分别利用不同的方法提取特征参数;
对各个模态所包含的特征参数进行归一化处理;
对进行归一化处理后的特征参数进行加权融合,生成融合特征参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吾征智能技术(北京)有限公司,未经吾征智能技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110700737.4/2.html,转载请声明来源钻瓜专利网。