[发明专利]基于电子病历的疾病症状关联分析方法有效
申请号: | 201810619124.6 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108806767B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 李芳芳;段昱;毛星亮 | 申请(专利权)人: | 中南大学 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06F16/28;G06F16/2455 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 电子 病历 疾病 症状 关联 分析 方法 | ||
1.一种基于电子病历的疾病症状关联分析方法,包括如下步骤:
S1.获取电子病历的数据,对电子病历进行预处理并转换为结构化数据;
S2.构建不平衡数据集的分类器;具体为采用如下步骤构建分类器:
(1).获取电子病历中的训练数据,得到训练数据的候选频繁项集;具体为对训练数据采用Apriori算法,同时设置最小支持度阈值,从而得到满足最小支持度阈值的候选频繁项集;
(2).对步骤(1)得到的候选频繁项集进行过滤;
(3).将候选关联规则分类至相应类别的规则集合中;
(4).衡量规则前件和后件的相关性,从而得到各类别相关的分类关联规则;
(5).以规则强度作为衡量指标对步骤(4)得到的分类关联规则进行过滤和排序,从而得到分类器;具体为采用如下步骤进行过滤、排序并得到分类器:
ⅰ.采用如下公式计算分类关联规则的规则强度:
式中RS(A→B)为规则A→B的规则强度,sup p为规则A→B的支持度,conf为规则A→B的置信度,er为规则A→B的增比率,lift为规则A→B的的兴趣度;
ⅱ.对于任意规则Rp和Rn,若Rp是Rn的泛化规则且RS(Rp)>RS(Rn),则认定规则Rn是冗余并将规则Rn删除;
ⅲ.对最终的规则按类别进行排序,从而形成最终的分类器;
S3.根据步骤S2得到的分类器,对疾病症状进行关联分析。
2.根据权利要求1所述的基于电子病历的疾病症状关联分析方法,其特征在于步骤S1所述的对电子病历进行预处理并转换为结构化数据,具体为采用如下步骤进行预处理和转换:
A.确定电子病历中的疾病特征;
B.对电子病历中的缺失值进行填充;
C.对电子病历中的连续特征进行离散化处理。
3.根据权利要求2所述的基于电子病历的疾病症状关联分析方法,其特征在于步骤(2)所述的对候选频繁项集进行过滤,具体为设置最小增比率阈值,然后采用如下规则进行过滤:
若频繁项集的增比率低于最小增比率阈值,则将该频繁项集过滤;
若频繁项集的增比率大于或等于最小增比率阈值,则将该频繁项集保留;
若频繁项集的增比率无穷大,则该频繁项集的增比率定义为该类别相关的所有频繁项集的增比率的均值。
4.根据权利要求3所述的基于电子病历的疾病症状关联分析方法,其特征在于所述的增比率,具体为采用如下算式计算频繁项集的增比率:
式中ER(x→C)为规则x→C的增比率,CSup(x→C)为类支持度且CSup(x→C)=N(x∪C)/N(C),N(x∪C)表示x和C同时出现在事务集D中的次数,N(C)表示类C在事务集中出现的次数,x表示规则前件,表示类C的补类。
5.根据权利要求4所述的基于电子病历的疾病症状关联分析方法,其特征在于步骤(3)所述的将候选关联规则分类至相应类别的规则集合,具体为设置增比置信度阈值,然后采用如下规则进行分类:
若候选关联规则的增比置信度大于或等于增比置信度阈值,则将该关联规则加入到对应类别的规则集合中;
若候选关联规则的增比置信度小于增比置信度阈值,则将该关联规则删除。
6.根据权利要求5所述的基于电子病历的疾病症状关联分析方法,其特征在于所述的候选关联规则的增比置信度,具体为采用如下算式计算增比置信度:
ERC(x→C)=ER(x→C)*Confidence(x→C)
式中ERC(x→C)为规则x→C的增比置信度,ER(x→C)为规则x→C的增比率,Confidence(x→C)为规则x→C的置信度,x为规则前件,C为规则后件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810619124.6/1.html,转载请声明来源钻瓜专利网。