[发明专利]一种基于属性权重聚类的疾病危险因素提取方法在审
申请号: | 201910139122.1 | 申请日: | 2019-02-25 |
公开(公告)号: | CN109978007A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 徐雷;姚澜 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16H50/00;G16H50/70 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 马鲁晋 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 疾病危险因素 准确率 矩阵 危险因素 用户信息 聚类 集合 标准化处理 标签向量 权重向量 属性增加 特征选择 向量构建 医学领域 用户调查 构建 权重 向量 标准化 问卷 改进 分析 | ||
本发明公开了一种基于属性权重聚类的疾病危险因素提取方法,该方法包括以下步骤:首先根据用户调查问卷,构建用户信息矩阵与标签向量;之后对用户信息矩阵进行标准化处理;然后对标准化用户信息矩阵进行特征选择,获得特征排名向量;之后根据特征排名向量构建属性权重向量;最后按权重排名依次增加属性并进行改进的K均值聚类分析,计算聚类准确率,若某项属性增加引起聚类准确率上升,则将该项属性加入危险因素集合,最终危险因素集合中的所有元素确定为疾病危险因素。相对于目前医学领域中危险因素提取方法中的频率论方法,本发明的方法根据聚类准确率曲线获得疾病危险因素,其效率、准确率更高。
技术领域
本发明属于大数据技术与医学领域,特别是一种基于属性权重聚类的疾病危险因素提取方法。
背景技术
胃食管反流疾病是指胃反流物反流入食管,引起不适症状和并发症的一种疾病,作为一种消化系统临床常见病,普遍存在于亚洲和西方各个国家,且发病率呈逐年升高的趋势。据研究发现,胃食管反流疾病与个人生活、饮食习惯、精神状况等多方面因素相关,且病情容易发生变化。因此,通过大数据技术探究引起胃食管反流疾病发病的危险因素对于该疾病的治疗与预防有重要意义。
目前针对引起胃食管反流等疾病的危险因素,各医学杂志根据临床经验以及理论知识总结出了可能引发该疾病的危险因素,但是这些方法往往存在一些弊端,一方面,大多数分析与研究往往存在样本量少,分析因素少,使得最终结果不具有泛化能力,人为分析需要大量的经验知识积累,缺乏权威性与科学性;另一方面,分析方法单一,大多基于统计学方法以及临床研究与医学经验相结合,当面临样本数足够多,疾病涉及因素广的情况时,此类方法往往导致效率低下,分析出的结果对于疾病的预防与诊治没有太大的帮助。
目前所存在的危险因素提取方法大多是基于传统统计学的统计推断方法,从对人群医学数据的分析中生成关于总体参数即致病因素的可能命题,估计由该因素引起患病的结果为偶然引发的概率。该类方法往往受到计算资源匮乏的限制,且计算方法单一,大多是基于t检验或卡方检验等方法对数据集进行验证。
在大数据分析技术中,聚类分析是处理复杂数据集的数值分类技术,是在缺乏划分标准或外在基准的情况下,根据事物本身的特性对所研究的对象进行分类。当前对于疾病危险因素的提取采用的聚类方法大多是层次聚类,在划分类簇时往往需要专业的医学知识对类簇特征进行确定,且计算量大。
发明内容
本发明所解决的技术问题在于提供一种从高维度医学疾病数据中提取关键致病因素的提取方法。
实现本发明目的的技术解决方案为:一种基于属性权重聚类的疾病危险因素提取方法,包括以下步骤:
步骤1、根据某种疾病的用户调查问卷,构建用户信息矩阵与标签向量;
步骤2、对所述用户信息矩阵进行标准化处理,获得标准化用户信息矩阵;
步骤3、对所述标准化用户信息矩阵进行特征选择,获得特征排名向量;
步骤4、根据所述特征排名向量构建属性权重向量;
步骤5、根据所述属性权重向量对标准化用户信息矩阵中的第一个调查问卷问题特征进行聚类,计算聚类准确率,之后逐一增加问题特征,并重新计算聚类准确率,直至聚类完所有问题特征,将其中引起准确率上升的问题特征加入危险因素集合,该集合中的每个元素即为疾病危险因素。
本发明与现有技术相比,其显著优点为:1)本发明利用特征选择技术解决了处理医学数据大样本、高维度的难题;2)本发明根据基于支持向量机的递归特征消除方法构建了属性权重向量,更具可解释性,相对于原始K均值聚类方法更能提高聚类准确性;3)相对于目前医学领域中危险因素提取方法中的频率论方法,本发明的方法根据聚类准确率曲线得出疾病危险因素,效率、准确率更高。
下面结合附图对本发明作进一步详细描述。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910139122.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人脸图像的聚类方法和装置
- 下一篇:基于距离变换的最近邻图潜在相似性优化方法