[发明专利]基于电子病历信息的中文疾病名称智能标准化方法与系统有效
申请号: | 201911232227.8 | 申请日: | 2019-12-05 |
公开(公告)号: | CN110991170B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 邓柯;李祺;刘军 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/126;G06K9/62;G16H10/60 |
代理公司: | 深圳市鼎言知识产权代理有限公司 44311 | 代理人: | 郑海威;曾昭毅 |
地址: | 100084 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 电子 病历 信息 中文 疾病 名称 智能 标准化 方法 系统 | ||
本发明提供一种基于电子病历信息的中文疾病名称智能标准化方法与系统,所述方法包括:获取待处理的电子病历,从电子病历中提取疾病名称;将提取的疾病名称输入至预设的标准化概率模型,得到疾病名称对应的标准化编码;其中,标准化概率模型的生成方式为:获取多份历史电子病历,从历史电子病历中提取疾病名称以及与疾病名称对应的疾病编码,生成疾病名称与疾病编码的映射列表;从预设的分类算法中选取至少两种分类算法建立至少两个预测模型,选择疾病名称与疾病编码映射列表中的数据分别对所述至少两个预测模型进行训练;对至少两个预测模型进行模型平均,得到标准化概率模型。所述方法可以更加准确的得到电子病历的疾病名称对应的标准化编码。
技术领域
本发明涉及电子病历信息的中文疾病名称智能标准化技术领域,具体涉及一种基于电子病历信息的中文疾病名称智能标准化方法与系统。
背景技术
对于电子病历的系统研究有助于我们更加系统的了解各种疾病在人群中的发生和传播情况,从而为公共卫生环境的改善提供帮助。在电子病历的研究中,对于疾病名称的识别是十分重要的一环。为了便于各地区之间的沟通与交流,世界卫生组织根据疾病的病因、病理、临床表现和解剖位置等特性,将疾病分门别类,制定了一套国际统一的疾病分类方法,目前使用的是第10次修订本《疾病和有关健康问题的国际统计分类》(InternationalClassification of Diseases)简称ICD-10,该编码系统是用字母加数字的方法对疾病进行编码。然而在实际电子病历的录入时,由于医生的命名习惯不同以及录入时间有限等原因,医生在系统中输入的疾病名称常常与标准疾病编码并不一致,这种名称使用上的不统一虽然不会给医务工作者之间的交流带来太多困难,但是却会给电子病历的研究人员带来了很大困扰,其原因主要有:疾病编码标准并未完全统一,虽然我国医疗机构普遍使用ICD-10编码作为基本的疾病编码系统,但是不同的医疗机构常常会根据自身的业务需求对国际标准的ICD-10编码系统进行不同程度的个性化修饰与扩充,从而导致不同地区的疾病编码系统存在部分编码不一致的情况。如何准确的识别出非标准的疾病名称对应的标准疾病编码是急需解决的技术问题。
发明内容
鉴于以上内容,有必要提出一种基于电子病历信息的中文疾病名称智能标准化方法、基于电子病历信息的中文疾病名称智能标准化系统,所述基于电子病历信息的中文疾病名称智能标准化方法可以更加准确的输出电子病历的疾病名称对应的标准化编码。
本申请的第一方面提供一种基于电子病历信息的中文疾病名称智能标准化方法,所述方法包括:
获取待处理的电子病历,从所述电子病历中提取疾病名称;
将提取出的所述疾病名称输入至预设的标准化概率模型,得到所述疾病名称对应的标准化编码;
其中,所述标准化概率模型的生成方式为:
获取多份历史电子病历,从所述历史电子病历中提取疾病名称以及与所述疾病名称对应的疾病编码,生成疾病名称与疾病编码的映射列表;
从预设的分类算法中选取至少两种分类算法建立至少两个预测模型,选择所述疾病名称与疾病编码映射列表中的数据分别对所述至少两个预测模型进行训练;
对所述至少两个预测模型进行模型平均,得到标准化概率模型。
优选地,所述预测模型的训练方法包括:
获取多份历史电子病历,所述多份历史电子病历中包括疾病名称和所述疾病名称对应的疾病编码;
从所述历史电子病历里获取疾病名称和所述疾病名称对应的疾病编码,生成疾病名称与疾病编码的映射列表;
对所述映射列表中的数据进行预设次数的交叉验证,在每次交叉验证中将其分为训练集和验证集;
建立基于分类算法的预测模型,并利用所述训练集对所述预测模型进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911232227.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:专用球墨铸铁穿墙管
- 下一篇:户外运动针织面料的生产工艺
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置