[发明专利]一种电子病历中传染病史的质控方法、系统、设备及介质在审
申请号: | 202210331642.4 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114722147A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 梁威;蒋文奇 | 申请(专利权)人: | 长沙博为软件技术股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F40/247;G06F40/289;G16H10/60 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 王浩 |
地址: | 410215 湖南省长沙市长沙*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 病历 传染 病史 方法 系统 设备 介质 | ||
本发明公开了一种电子病历中传染病史的质控方法、系统、设备及介质,步骤包括:提取目标电子病历的关键字特征,根据预设的知识图谱对关键字特征进行匹配,得到匹配结果,根据匹配结果判断目标电子病历对应病人的传染病史,减少了标注数据,而且通过提取电子病历的关键字特征与知识图谱技术进行匹配,达到更准确的传染病质控效果。
技术领域
本发明涉及电子病历技术领域,特别涉及一种电子病历中传染病史的质控方法、系统、设备及介质。
背景技术
随着我国医疗系统的不断完善,医疗资源包括医疗设备和医护人员队伍也在逐步壮大,但医疗资源紧缺、医院运行效率不高的情况仍然存在,其中电子病历系统采用电子设备来保存、管理、传输和重现数字化的病人的医疗记录,取代手写纸张病历。
目前一部分电子病历的质控技术是软件自带,只能起到简单的质控作用,例如内容是否为空,长度是否超过规定的长度,年龄是否超出范围等,还有一部分是使用自然语言处理技术来质控,通过大量的语料标注实体和关系,将标注的实体和关系送给预处理模型来构建任务模型,但提取出传染病概率非常小,而且分类多,预测类别不准,标注数据成指数级增长。
发明内容
本发明旨在至少解决现有技术中存在的技术问题。为此,本发明提出一种电子病历中传染病史的质控方法、系统、设备及介质,利用自然语言处理技术与知识图谱技术的结合,所需标注实体少,而且通过比较计算后补充无法查询到的传染病名称,修复传染病无法质控的问题,达到更准确的传染病质控。
第一方面,本发明提供了一种电子病历中传染病史的质控方法,包括以下步骤:
提取目标电子病历的关键字特征;
根据预设的知识图谱对所述关键字特征进行匹配,得到匹配结果;
根据所述匹配结果判断所述目标电子病历对应病人的传染病史。
根据本发明的实施例,至少具有如下技术效果:
本方法通过提取目标电子病历的关键字特征,根据预设的知识图谱对所述关键字特征进行匹配,得到匹配结果,根据所述匹配结果判断所述目标电子病历对应病人的传染病史,减少了标注数据,而且通过提取电子病历的关键字特征与知识图谱技术进行匹配,达到更准确的传染病质控效果。
根据本发明的一些实施例,通过自然语言处理方法提取目标电子病历的关键字。
根据本发明的一些实施例,所述提取目标电子病历的关键字特征,包括:
收集已有电子病历的关键字或人工修改所述已有电子病历的关键字,将所述关键字切分成小于或等于512个字符的长度,标注所述关键字之间的实体关系,输入至预设的任务模型中进行训练,得到训练完成的任务模型;
将所述目标电子病例进行数据清洗、转义和脱敏,生成文本数据;
将所述文本数据输入所述训练完成的任务模型中得到所述目标电子病例的关键字特征。
根据本发明的一些实施例,所述预设的任务模型为BERT模型。
根据本发明的一些实施例,所述根据预设的知识图谱对所述关键字特征进行匹配,得到匹配结果,包括:
将所述目标电子病例中的关键字特征在预设的知识图谱中进行过滤处理,得到所述匹配结果;
若所述匹配结果为在预设的知识图谱中查询到相同的关键字特征或关键字特征的同义词,则本轮匹配结束;
若所述匹配结果为在预设的知识图谱中无法查询到所述关键字特征或关键字特征的同义词,则在所述预设的知识图谱中补充无法查询到的关键字特征。
第二方面,本发明提供了一种电子病历中传染病史的质控系统,包括以下模块:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙博为软件技术股份有限公司,未经长沙博为软件技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210331642.4/2.html,转载请声明来源钻瓜专利网。