[发明专利]基于电子病历信息的中文疾病名称智能标准化方法与系统有效
申请号: | 201911232227.8 | 申请日: | 2019-12-05 |
公开(公告)号: | CN110991170B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 邓柯;李祺;刘军 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/126;G06K9/62;G16H10/60 |
代理公司: | 深圳市鼎言知识产权代理有限公司 44311 | 代理人: | 郑海威;曾昭毅 |
地址: | 100084 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 电子 病历 信息 中文 疾病 名称 智能 标准化 方法 系统 | ||
1.一种基于电子病历信息的中文疾病名称智能标准化方法,其特征在于,所述方法包括:
获取待处理的电子病历,从所述电子病历中提取疾病名称;
将提取出的所述疾病名称输入至预设的标准化概率模型,得到所述疾病名称对应的标准化编码;
其中,所述标准化概率模型的生成方式为:
获取多份历史电子病历,从所述历史电子病历中提取疾病名称以及与所述疾病名称对应的疾病编码,去除所述疾病名称和所述疾病编码中多余的空格、标点、字符信息后生成疾病名称与疾病编码的映射列表;
从预设的分类算法中选取至少两种分类算法建立至少两个预测模型,选择所述疾病名称与疾病编码映射列表中的数据分别对所述至少两个预测模型进行训练;
对所述至少两个预测模型进行模型平均,得到标准化概率模型,包括:
统计朴素贝叶斯算法的预测模型、多分类支持向量机算法的预测模型、逻辑回归分类算法的预测模型、决策树分类算法的预测模型、神经网络算法的预测模型中至少两个预测模型的预测准确率;
根据所述至少两个预测模型的预测准确率赋予预设权重值,其中预测准确率高的预测模型赋予的权重值高;
其中,所述标准化概率模型包含所述至少两个预测模型以及每一预测模型对应的权重。
2.如权利要求1所述的基于电子病历信息的中文疾病名称智能标准化方法,其特征在于,所述预测模型的训练方法包括:
获取多份历史电子病历,所述多份历史电子病历中包括疾病名称和所述疾病名称对应的疾病编码;
从所述历史电子病历里获取疾病名称和所述疾病名称对应的疾病编码,生成疾病名称与疾病编码的映射列表;
对所述映射列表中的数据进行预设次数的交叉验证,在每次交叉验证中将其分为训练集和验证集;
建立基于分类算法的预测模型,并利用所述训练集对所述预测模型进行训练;
利用训练后的所述预测模型对所述验证集中的疾病名称进行预测,并将预测得到的疾病编码与验证集中疾病名称对应的疾病编码进行比对;
若经过比对,所述预测的疾病名称的标准化编码与验证集中疾病名称对应的疾病编码不一致,则对验证集中的疾病名称进行修正后重新代入预测模型进行预测。
3.如权利要求1所述的基于电子病历信息的中文疾病名称智能标准化方法,其特征在于,建立所述标准化概率模型之后还包括:
获取所述标准化概率模型的预测结果,并根据预测结果建立映射规则数据库和错误匹配数据清单;
其中,所述映射规则数据库中存储了获取的电子病历中的疾病名称与疾病编码匹配的映射关系;
所述错误匹配数据清单中存储了获取的电子病历中的疾病名称与疾病编码不匹配的疾病名称和疾病编码清单。
4.如权利要求3所述的基于电子病历信息的中文疾病名称智能标准化方法,其特征在于,获取所述标准化概率模型的预测结果,并根据预测结果建立映射规则数据库和错误匹配数据清单的步骤包括:
将根据所述标准化概率模型预测的疾病名称在标准化编码下的预测概率与一预设的概率阈值进行比较;
若经过所述标准化概率模型预测的疾病名称在疾病名称的标准化编码下的预测概率大于预设的概率阈值,则将电子病历中获取的疾病名称与疾病编码的映射关系存储于映射规则数据库,所述映射规则数据库中存储了获取的电子病历中的疾病名称与疾病编码匹配的映射关系;
若经过所述标准化概率模型预测的疾病名称在疾病名称的标准化编码下的预测概率小于预设的概率阈值,则将电子病历中获取的疾病名称与疾病编码的映射关系存储于错误匹配数据清单,所述错误匹配数据清单中存储了获取的电子病历中的疾病名称与疾病编码不匹配的疾病名称和疾病编码清单。
5.如权利要求4所述的基于电子病历信息的中文疾病名称智能标准化方法,其特征在于,所述步骤还包括:
接收更正指令,对所述错误匹配数据清单中数据进行更正,所述更正的内容包括如下一种或两种:更正疾病名称的描述方式、更正与疾病名称不匹配的疾病编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911232227.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:专用球墨铸铁穿墙管
- 下一篇:户外运动针织面料的生产工艺
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置