[发明专利]一种电子病历结构化方法、系统及相关设备在审
申请号: | 202010131426.6 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111352987A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 汤学民 | 申请(专利权)人: | 汤学民 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/332;G16H10/60;G06F40/284 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王学强 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 病历 结构 方法 系统 相关 设备 | ||
1.一种电子病历结构化方法,其特征在于,包括:
获取目标电子病历文本,并根据预设语料词库及预设分词规则对所述目标电子病历文本进行分词形成分词集合;
采用预设的关键词与所述分词集合中的分词进行匹配,并确定匹配成功的目标关键词对应的数据元作为目标类型数据元,每一个关键词至少对应一种类型的数据元;
根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值;
将所述目标电子病历文本的所有目标类型数据元关联存储。
2.根据权利要求1所述的方法,其特征在于,当所述目标类型数据元的取值类型为标志型时,所述根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值,包括:
判断所述目标关键词前文或后文是否存在否定意思表达,若存在否定意思表达,则确定所述目标类型数据元的数据元值为否定,否则确定所述目标类型数据元的数据元值为肯定。
3.根据权利要求2所述的方法,其特征在于,在所述判断所述目标关键词前文或后文是否存在否定意思表达之前,所述方法还包括:
判断所述目标关键词前文或后文是否包含预设分词,若包含预设分词,则将所述预设分词与所述目标关键词合并为新数据元名称;
和/或,
判断所述目标关键词前文或后文是否包含虚拟表述,若存在虚拟表述,则终止提取所述目标类型数据元的数据元值。
4.根据权利要求1所述的方法,其特征在于,当所述目标类型数据元的取值类型为枚举型时,所述根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值,包括:
判断所述目标关键词前文或后文是否包含预设分词,若包含预设分词,则判断所述目标关键词的后文中是否存在匹配的枚举值,若存在匹配的枚举值,则确定所述目标类型数据元的数据元值为所述匹配的枚举值。
5.根据权利要求4所述的方法,其特征在于,在所述判断所述目标关键词前文或后文是否包含预设分词之后,所述方法还包括:
判断所述目标关键词前文或后文是否存在否定意思表达,若存在否定意思表达,则终止提取所述目标类型数据元的数据元值;
和/或,
判断所述目标关键词前文或后文是否包含虚拟表述,若存在虚拟表述,则终止提取所述目标类型数据元的数据元值。
6.根据权利要求1所述的方法,其特征在于,当所述目标类型数据元的取值类型为数字型时,所述根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值,包括:
判断所述目标关键词前文或后文是否包含预设分词,若包含预设分词,则判断所述目标关键词的后文中是否存在数字和单位,若存在数字和单位,则确定所述目标类型数据元的数据元值为所述数字和单位。
7.根据权利要求1所述的方法,其特征在于,当所述目标类型数据元的取值类型为日期型时,所述根据所述目标类型数据元的提取规则从所述目标电子病历文本中提取所述目标类型数据元的数据元值,包括:
判断所述目标关键词前文或后文是否包含预设分词,若包含预设分词,则判断所述目标关键词的后文中是否存在日期型数据,若存在日期型数据,则确定所述目标类型数据元的数据元值为所述日期型数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤学民,未经汤学民许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010131426.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种温压复合传感器的制作方法
- 下一篇:数据同步补救、存储方法及集群装置