[发明专利]老年健康数据知识分析方法和系统在审
申请号: | 201910854775.8 | 申请日: | 2019-09-10 |
公开(公告)号: | CN110729052A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 顾东晓;李童童;李兴国;王晓玉;江政;陆文星;钟金宏;赵树平;杨雪洁;苏凯翔;叶紫薇;苗夏雨 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H10/20 |
代理公司: | 11542 北京久诚知识产权代理事务所(特殊普通合伙) | 代理人: | 余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 老年健康 调查数据 评价指标 知识发现 自变量 数据处理技术 老年人健康 基于机器 集成学习 解释机器 数据知识 特征选择 维度分析 影响因素 解释性 学习性 因变量 构建 分析 引入 融入 学习 | ||
本发明提供一种老年健康数据知识分析方法和系统,涉及数据处理技术领域。本发明提出了基于集成学习的特征选择方法,构建知识发现模型,同时融入基于机器学习评价指标和解释机器学习性评价方法,使得老年健康调查数据知识发现模型既有评价指标又引入了解释性评价方法,能从多个维度分析老年健康调查数据中的自变量与因变量的关系,从而能准确、全面的分析出老年人健康影响因素。
技术领域
本发明涉及数据处理技术领域,具体涉及一种老年健康数据知识 分析方法和系统。
背景技术
老年健康数据包括日常活动能力、器具性活动能力、教育程度、 工作类型、运动习惯、饮食健康、医疗服务、心理状态等方面的个人 数据。老年健康数据具有复杂性、精确性、安全性、异构性及封闭性 的特点。对老年人健康影响因素的全面分析研究,对于科学认识老龄 化健康问题和实现健康的老龄化具有重要意义。
长期以来,健康普查数据的分析方法一直是统计方法或者简单的 线性回归分析,即通过提出假设再进行挖掘验证数据中的关系。
然而,现有的基于统计方法或者简单的线性回归分析的健康普查 数据的分析方法虽然可以较为充分的利用有限的宝贵数据,但提出的 假设一般是基于某个主要因素,例如居住模式、教育水平、经济地位 等进行相应的考察,没有结合多个方面的具体因素进行综合考虑,存 在一定的局限性,导致分析结果准确度不高。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种老年健康数据知识分析 方法和系统,解决了分析结果准确度不高的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明提供一种老年健康数据知识分析方法,所述方法由计算机 执行,包括以下步骤:
S1、获取老年健康调查数据;
S2、对所述老年健康调查数据进行预处理;
S3、对预处理之后的老年健康调查数据进行集成特征选择,得到 关键特征;
S4、基于所述关键特征获取知识发现模型;
S5、基于机器学习评价指标、解释机器学习性评价方法和所述知 识发现模型,获取老年健康调查数据知识发现模型;
S6、基于所述老年健康调查数据知识发现模型分析所述老年健康 调查数据,得到所述老年健康调查数据中的自变量与因变量的关系。
优选的,所述预处理包括缺失值处理。
优选的,所述缺失值处理包括:
S201、记一组老年健康调查数据为x1......xk,以统一的形式表示 这组老年健康调查数据中的缺失值;
S202、从第一个老年健康调查数据开始,如果x1有缺失值,将在 其他变量x2到xk上回归,将x1中的缺失值替换为预测值,所述预测值由 来自x1的后验预测分布模拟得出;
S203、对于下一个具有缺失值的老年健康调查数据xi,在所有其他 老年健康调查数据x1......xk上回归,xi中的缺失值被来自xi的后验预测分 布的模拟值所取代,将老年健康调查数据中的所有缺失值进行替换。
优选的,所述集成特征选择包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910854775.8/2.html,转载请声明来源钻瓜专利网。