[发明专利]一种电子病历结构化方法、系统及相关设备在审
申请号: | 202010131426.6 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111352987A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 汤学民 | 申请(专利权)人: | 汤学民 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/332;G16H10/60;G06F40/284 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王学强 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 病历 结构 方法 系统 相关 设备 | ||
本发明实施例提供了一种电子病历结构化方法、系统及相关设备,用于提高病历信息提取效率。本发明实施例方法包括:获取目标电子病历文本,并根据预设语料词库及预设分词规则对所述目标电子病历文本进行分词形成分词集合;采用预设的关键词与所述分词集合中的分词进行匹配,并确定匹配成功的目标关键词对应的数据元作为目标类型数据元,每一个关键词至少对应一种类型的数据元;根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值;将所述目标电子病历文本的所有目标类型数据元关联存储。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种电子病历结构化方法、系统及相关设备。
背景技术
病历是各类医疗文书的集合,而病历的多学科高维度的数据结构对一个经验丰富的人员者来说,要全面掌握其中的信息也是十分困难。而且病历的大部分内容都是非结构化的、自然语言(非标准化)形成的文本,仅有病案首页实现了结构化和标准化。但是病案首页上的信息是经过浓缩的,信息量十分有限。
现有方案中,对于病历信息的提取,例如详细的症状、体格检查、病史病程、检查化验等,均需要查阅病历信息,往往需要不同专业的人员需要针对病历的不同方面多次阅读,从而获取不同方面的信息。目前,不管是纸质归档病案还是电子归档病案,都需要人工阅读原始病历,在各类病历信息提取的工作中不得不耗费大量人力物力。
发明内容
本发明实施例提供了一种电子病历结构化方法、系统及相关设备,用于提高病历信息提取效率。
本发明实施例第一方面提供了一种电子病历结构化方法,其特征在于,包括:
获取目标电子病历文本,并根据预设语料词库及预设分词规则对所述目标电子病历文本进行分词形成分词集合;
采用预设的关键词与所述分词集合中的分词进行匹配,并确定匹配成功的目标关键词对应的数据元作为目标类型数据元,每一个关键词至少对应一种类型的数据元;
根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值;
将所述目标电子病历文本的所有目标类型数据元关联存储。
可选的,作为一种可能的实施方式,当所述目标类型数据元的取值类型为标志型时,所述根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值,包括:
判断所述目标关键词前文或后文是否存在否定意思表达,若存在否定意思表达,则确定所述目标类型数据元的数据元值为否定,否则确定所述目标类型数据元的数据元值为肯定。
可选的,作为一种可能的实施方式,在所述判断所述目标关键词前文或后文是否存在否定意思表达之前,所述方法还包括:
判断所述目标关键词前文或后文是否包含预设分词,若包含预设分词,则将所述预设分词与所述目标关键词合并为新数据元名称;
和/或,
判断所述目标关键词前文或后文是否包含虚拟表述,若存在虚拟表述,则终止提取所述目标类型数据元的数据元值。
可选的,作为一种可能的实施方式,当所述目标类型数据元的取值类型为枚举型时,所述根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值,包括:
判断所述目标关键词前文或后文是否包含预设分词,若包含预设分词,则判断所述目标关键词的后文中是否存在匹配的枚举值,若存在匹配的枚举值,则确定所述目标类型数据元的数据元值为所述匹配的枚举值。
可选的,作为一种可能的实施方式,在所述判断所述目标关键词前文或后文是否包含预设分词之后,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤学民,未经汤学民许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010131426.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种温压复合传感器的制作方法
- 下一篇:数据同步补救、存储方法及集群装置