[发明专利]一种电子病历数据的解析方法及装置在审
申请号: | 201911346926.5 | 申请日: | 2019-12-24 |
公开(公告)号: | CN113033177A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 杨宝山;强晟 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/186;G06F16/84;G16H10/60 |
代理公司: | 北京嘉科知识产权代理事务所(特殊普通合伙) 11687 | 代理人: | 刘力 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 病历 数据 解析 方法 装置 | ||
本发明公开了一种电子病历数据的解析方法、装置、计算机可读存储介质及电子设备,方法包括:确定待解析电子病历文档对应的文本串序列;根据预设字段名称集合和所述待解析电子病历文档对应的文本串序列,确定所述待解析电子病历文档对应的配置文件集合;根据所述待解析电子病历文档对应的配置文件集合,对所述待解析电子病历文档中的电子病历数据进行解析。通过本发明的技术方案,可提高对待解析电子病历文档中电子病历数据的解析效率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种电子病历数据的解析方法及装置。
背景技术
随着计算机技术的发展,电子病历的数量呈现爆发式的增长,电子病历(Electronic Medical Record,简称EMR)是利用电子设备(如,计算机)来保存、管理、传输和重现的数字化的医疗记录,一般包括病人的疾病和诊疗情况。电子病历能够取代手写纸张病历,便于进行数字化、信息化的管理。电子病历大多是自然语言记录的文档,一般以可扩展标准语言(Extensible Markup Language,简称XML)或超文本标记语言(Hyper TextMarkup Language,简称HTML)结构下的文本内容形式呈现,通常需要对电子病历进行解析,进而获得结构化电子病历,之后,即可对结构化电子病历进行数据挖掘。由于电子病历种类繁多,内容量大,如何用简洁、高效的方式对其进行解析是亟待解决的问题。
目前,通过人工分析电子病历中的文本,在了解电子病历中数据的可扩展标准语言标签或者超文本标记语言标签的作用后,每个标签对应一段定位到具体标签位置和抽取数据的代码,从而解析出电子病历中的文本。
但是,电子病历的可扩展标准语言标签或者超文本标记语言标签的种类很多,常达上千种,涉及的标签结构可能成千上万,使得解析效率较低。
发明内容
本发明提供了一种电子病历数据的解析方法、装置、计算机可读存储介质及电子设备,可提高对待解析电子病历文档中电子病历数据的解析效率。
第一方面,本发明提供了一种电子病历数据的解析方法,包括:
确定待解析电子病历文档对应的文本串序列;
根据预设字段名称集合和所述待解析电子病历文档对应的文本串序列,确定所述待解析电子病历文档对应的配置文件集合;
根据所述待解析电子病历文档对应的配置文件集合,对所述待解析电子病历文档中的电子病历数据进行解析。
优选地,所述确定待解析电子病历文档对应的文本串序列,包括:
获取待解析电子病历文档;
根据预设标点符号,对所述待解析电子病历文档中的文本内容进行分句,确定所述待解析电子病历文档对应的文本串序列。
优选地,所述根据预设字段名称集合和所述待解析电子病历文档对应的文本串序列,确定所述待解析电子病历文档对应的配置文件集合,包括:
根据预设字段名称集合,对所述待解析电子病历文档对应的文本串序列进行字段划分,确定所述待解析电子病历文档对应的至少一个字段名称组合,所述字段名称组合包括开始字段名称和结束字段名称;
针对每个所述字段名称组合,确定所述字段名称组合对应的字段配置文件;
根据各个所述字段名称组合分别对应的字段配置文件,确定所述待解析电子病历文档对应的配置文件集合。
优选地,所述确定所述字段名称组合对应的字段配置文件,包括:
生成所述字段名称组合对应的初始字段配置文件;
将预设辅助函数加入所述初始字段配置文件中,以确定所述字段名称组合对应的字段配置文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911346926.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置