[发明专利]一种基于标准差和交互信息的慢性疾病特征选择方法在审
申请号: | 202111485486.9 | 申请日: | 2021-12-07 |
公开(公告)号: | CN114358989A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 张清华;吴鹏;胡峰;高满;彭一航;周靖鹏 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06Q50/22 | 分类号: | G06Q50/22;G16H50/30;G06Q10/04;G06K9/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标准差 交互 信息 慢性 疾病 特征 选择 方法 | ||
本发明属于计算机科学技术领域,具体涉及一种基于标准差和交互信息的慢性疾病特征选择方法;该方法包括:实时获取用户的身体检查数据,对数据进行预处理,将预处理后的数据输入到基于标准差和交互信息的慢性疾病特征选择模型中,预测用户患有的慢性疾病类型;本发明可以有效地对高血压、糖尿病等慢性疾病的影响因素进行筛选并标记,通过对影响因素的分析统计来预防或预测慢性疾病,本发明为慢性疾病的预警提供帮助,克服了现有慢性疾病预测需要较多特征并且精确度不高的缺陷,具有良好的经济效益。
技术领域
本发明属于计算机科学技术领域,具体涉及一种基于标准差和交互信息的慢性疾病特征选择方法。
背景技术
随着老龄化时代的提前到来,老年人的健康问题引起了社会越来越多的关注,其中,高血压、糖尿病和冠心病等慢性疾病已经成为威胁老年人健康的首要原因,引起了众多领域的专家学者们的高度重视。近年来,为了减低老龄人口中慢性疾病的发病率,及时预测预警慢性疾病的产生与发展,慢性疾病的影响因素被广泛研究。
临床医学和公共卫生领域拥有着各种各样与慢性疾病问题相关的数据,以往慢性疾病相关因素的研究大部分是借用传统统计学方法,然而随着大数据时代的来临,传统统计学方法在高维数据建模中存在着较多的局限性;与此同时,机器学习算法开始兴起,支持向量机等算法在各个领域中有广泛应用,但机器学习算法面对高维数据建模时也存在着一些困难,因此诞生了许多特征选择方法。
特征选择,就是从具有众多特征的高维数据集,剔除与类别标签不相关或冗余的特征,选出一些与类别标签有高度相关性的特征,它们构成最优特征的集合,即最优特征子集,该集合所表达出来的信息能很好地替代原始的全部特征。该最优特征子集在分类性能的基础上,还可以对数据进行降维,减少计算和存储开销,以构造一个高效的分类器。
特征选择本质上是要得到原始特征域的一个最佳子域,且样本在该最优子空间的分类性能与原始空间上的分类性能相比不会下降,并且该最优子空间的特征数量尽量达到最小。根据特征选择方法与分类器之间的关系,可以将其分为:过滤式、封装式以及嵌入式的特征选择方法。其中,过滤式特征选择方法根据每个特征对分类贡献度的大小来定义特征的重要程度,并进行排序。由于其在降维方面具有高效性和可扩展性,因此被广泛应用于各个领域。
但是传统的过滤式特征选择方法存在一些不足之处。首先,他们只考虑了候选特征与类别之间的信息量。然而,当一个新的特征加入选特征集合时,集合中每个目标特征与类别之间的信息量却发生了改变,因此有必要考虑目标特征与类别之间信息的动态变化。其次,特征选择研究往往聚焦于移除不相关和冗余的特征,却忽略了交互特征的存在,交互特征是指那些似乎与类别关联性较小,但当其与其他特征相结合后,产生的交互信息使得该特征与类别高度相关。因此交互特征的发现是特征选择不可或缺的环节。除此之外,根据过滤式特征选择的原理,评估函数是度量特征与类别之间相关性的最终指标,然而,传统的特征选择方法鲜少考虑到相同得分的情况。当两个或更多特征有相同分数时,选择出对类别更为重要的特征是一个必要的环节。
综上所述,需要一种既考虑目标特征与类别之间信息的动态变化,又考虑了特征之间协同性的特征选择方法,此方法可在目标特征集合的条件下,选择出与类别具有更高相关性的特征,从而达到更全面且精确地选择出对于类别有决定性作用的特征子集,得到慢性疾病的影响因素,通过对影响因素的分析统计来预防或预测慢性疾病。
发明内容
针对现有技术存在的不足,本发明提出了一种基于标准差和交互信息的慢性疾病特征选择方法,该方法包括:实时获取用户的身体检查数据,对数据进行预处理,将预处理后的数据输入到基于标准差和交互信息的慢性疾病特征选择模型中,得到慢性疾病影响因素并对影响因素进行标记;
基于标准差和交互信息的慢性疾病特征选择模型的训练过程包括:
S1:获取原始数据;
S2:将原始数据划分为10个集合,在10个集合中随机选取9个集合作为训练集,剩余1个集合作为测试集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111485486.9/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置