[发明专利]基于电子病历的疾病症状关联分析方法有效
申请号: | 201810619124.6 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108806767B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 李芳芳;段昱;毛星亮 | 申请(专利权)人: | 中南大学 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06F16/28;G06F16/2455 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 电子 病历 疾病 症状 关联 分析 方法 | ||
本发明公开了一种基于电子病历的疾病症状关联分析方法,包括获取电子病历的数据并处理;构建不平衡数据集的分类器;采用分类器对疾病症状进行关联分析。本发明通过对电子病历进行处理获取基础数据,然后根据基础数据构造相应的新型不平衡数据集的分类器,再利用该分类器进行疾病与症状的关联分析,因此本发明方法能够对疾病症状进行较为准确的关联,而且方法简答、科学和可靠。
技术领域
本发明具体涉及一种基于电子病历的疾病症状关联分析方法。
背景技术
随着信息技术的高速发展,我国的医疗事业也随之进入了信息化时代。由于国家政策的支持以及我国人口众多,因此在我国每天都会产生大量的医疗数据,而电子病历(Electronic Medical Record,EMR)是这些医疗数据的主要载体。
随着智能化时代的到来,疾病的诊疗也已经逐步开启了智能化时代,即利用现有的技术资料,以及患者的实际病情和相关数据,对患者的疾病进行辅助性的预测或辅助性的预诊断,从而为医护人员提供一定的帮助。电子病历中包括了患者的基本信息、疾病症状以及疾病种类等非常重要的信息,因此对电子病历的处理也成为了智能医疗的基础工作之一。
在对电子病历进行分类时,其往往是一个不平衡数据集,那么对于电子病历的处理的本质就是对不平衡数据集的处理。目前的不平衡数据集的分类方法,往往较为复杂,而且精度相对不高,影响了不平衡数据集的分类效果。正因如此,对于电子病历的处理效果也相对不佳,从而严重影响了后续的工作。
发明内容
本发明的目的在于提供一种能够对疾病症状进行较为准确的关联的基于电子病历的疾病症状关联分析方法。
本发明提供的这种基于电子病历的疾病症状关联分析方法,包括如下步骤:
S1.获取电子病历的数据,对电子病历进行预处理并转换为结构化数据;
S2.构建不平衡数据集的分类器;
S3.根据步骤S2得到的分类器,对疾病症状进行关联分析。
步骤S1所述的对电子病历进行预处理并转换为结构化数据,具体为采用如下步骤进行预处理和转换:
A.确定电子病历中的疾病特征;
B.对电子病历中的缺失值进行填充;
C.对电子病历中的连续特征进行离散化处理。
步骤S2所述的构建不平衡数据集的分类器,具体为采用如下步骤构建分类器:
(1).获取电子病历中的训练数据,得到训练数据的候选频繁项集;
(2).对步骤(1)得到的候选频繁项集进行过滤;
(3).将候选关联规则分类至相应类别的规则集合中;
(4).衡量规则前件和后件的相关性,从而得到各类别相关的分类关联规则;
(5).以规则强度作为衡量指标对步骤(4)得到的分类关联规则进行过滤和排序,从而得到分类器。
步骤(1)所述的得到训练数据的候选频繁项集,具体为对训练数据采用Apriori算法,同时设置最小支持度阈值,从而得到满足最小支持度阈值的候选频繁项集。
步骤(2)所述的对候选频繁项集进行过滤,具体为设置最小增比率阈值,然后采用如下规则进行过滤:
若频繁项集的增比率低于最小增比率阈值,则将该频繁项集过滤;
若频繁项集的增比率大于或等于最小增比率阈值,则将该频繁项集保留;
若频繁项集的增比率无穷大,则该频繁项集的增比率定义为该类别相关的所有频繁项集的增比率的均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810619124.6/2.html,转载请声明来源钻瓜专利网。