[发明专利]电子病历文书数据处理方法、装置及计算机可读存储介质在审
申请号: | 202011423953.0 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112420145A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 何国平;尹伟东;王旭英;甄化春;郭亚强 | 申请(专利权)人: | 医惠科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06F16/36;G06F40/279;G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘新雷 |
地址: | 310053 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 病历 文书 数据处理 方法 装置 计算机 可读 存储 介质 | ||
1.一种电子病历文书数据处理方法,其特征在于,包括:
对待处理电子病历文书进行数据预处理,得到满足预设文件筛选条件的标准病历文书;
调用后结构化模型对所述标准病历文书进行段落切分,段落主题识别和实体属性关系抽取,得到初始后结构化解析数据;所述后结构化模型预先利用与医院信息化系统封装方法兼容的封装方法进行封装,并设置应用程序服务接口;
根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析。
2.根据权利要求1所述的电子病历文书数据处理方法,其特征在于,所述根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析之后,还包括:
基于预先设置的数据库解析结果表结构,对所述初始后结构化解析数据的解析结果进行格式转化;
将转化后的解析结果存储至相应数据库中。
3.根据权利要求1所述的电子病历文书数据处理方法,其特征在于,所述后结构化模型包括病历文书段落切分模型、段落主题识别模型和实体属性关系模型;所述段落主题识别模型和所述实体属性关系模型采用tensorflow-serving框架;
其中,所述病历文书段落切分模型基于识别的段落开始和/或结束标志对所述标准病历文书进行段落切分;
所述段落主题识别模型基于医学专业词库识别各段落的类别;
所述实体属性关系模型包括实体属性识别模型和关系抽取模型,所述实体属性识别模型用于识别各段落中的实体信息和属性信息,所述关系抽取模型用于按照医学逻辑构建规则形成实体-属性关系对。
4.根据权利要求3所述的电子病历文书数据处理方法,其特征在于,所述后结构化模型还包括属性关系对过滤模块;
所述属性关系对过滤模块用于利用医学知识图谱对所述实体属性关系模型输出的所有实体-属性关系对进行过滤,剔除不符合医学逻辑的实体-属性关系对。
5.根据权利要求3所述的电子病历文书数据处理方法,其特征在于,所述后结构化模型还包括前优化模块、模型结果修正模块和链接模块;
所述前优化模块用于按照预设规则对所述病历文书段落切分模型和/或所述段落主题识别模型和/或所述实体属性关系模型的训练样本数据格式进行处理;
所述模型结果修正模块用于根据预设标准要求对所述病历文书段落切分模型和/或所述段落主题识别模型和/或所述实体属性关系模型的输出结果进行校正;
所述链接模块用于按照所述后结构化模型的数据处理流程将各所述前优化模块、所述病历文书段落切分模型、所述段落主题识别模型、所述实体属性关系模型和所述模型结果修正模块进行链接和整合。
6.根据权利要求1至5任意一项所述的电子病历文书数据处理方法,其特征在于,所述根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析包括:
从所述后结构化模型的应用程序接口读取解析数据字符串;
根据所述业务需求信息从所述解析数据字符串中提取相应目标指标数据;
调用与所述目标指标数据相匹配的文书格式模板对所述目标指标数据进行解析,得到初始解析结果。
7.根据权利要求6所述的电子病历文书数据处理方法,其特征在于,所述调用与所述目标指标数据相匹配的文书格式模板对所述目标指标数据进行解析之后,还包括:
对所述初始解析结果进行优化处理操作,所述优化处理操作包括以下任意一项或任意组合:
段落类型的错误修正、添加段落更新标识、生成日志记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医惠科技有限公司,未经医惠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011423953.0/1.html,转载请声明来源钻瓜专利网。