[发明专利]病历模板的创建方法及装置在审
申请号: | 201910891498.8 | 申请日: | 2019-09-19 |
公开(公告)号: | CN110853716A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 齐振宇;陈炜;刘焱;徐爽 | 申请(专利权)人: | 北京紫冬认知科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F16/35;G06F16/36;G06F40/186;G06F40/211 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 王卫忠 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病历 模板 创建 方法 装置 | ||
1.一种病历模板的创建方法,其特征在于,包括:
获取病历对应的文本集合;
针对所述文本集合中的每一文本,识别所述文本中与所述病历相关的关键字;
根据所述关键字创建所述病历对应的病历模板。
2.根据权利要求1所述的方法,其特征在于,所述获取病历对应的文本集合包括:
获取多个电子病历;
针对每一所述电子病历,从所述电子病历中提取目标文本;
将提取到的所有目标文本组成病历对应的文本集合。
3.根据权利要求1所述的方法,其特征在于,所述识别所述文本中与所述病历相关的关键字包括:
对所述文本进行语句拆分得到多个子句;
对所述多个子句进行聚类,其中同一类别中的不同子句之间的编辑距离相似度大于预设阈值;
针对每一所述类别,对所述类别中的每一子句进行命名实体识别,得到与所述病历相关的关键字。
4.根据权利要求3所述的方法,其特征在于,所述对所述文本进行语句拆分得到多个子句包括:
对所述文本进行语句拆分得到多个句子,并确定每一句子的所属字段;
针对每一句子,依据与所述句子的所属字段对应的启发式规则,对所述句子进行拆分,得到多个子句,并为每一子句添加病历id和所属字段的字段名。
5.根据权利要求3所述的方法,其特征在于,所述对所述多个子句进行聚类包括:
依据字段名对所述多个子句进行分类,得到多个子句集合,其中,同一子句集合中的子句具有相同的字段名;
针对每一所述子句集合,从所述子句集合中选择不属于任一类别的子句作为当前子句;
计算所述当前子句与不属于任一类别的其他子句之间的编辑距离相似度,若所述编辑距离相似度大于预设阈值,则将所述其他子句与所述当前子句归入同一类别;返回从所述子句集合中选择不属于任一类别的子句作为当前子句的步骤。
6.根据权利要求3所述的方法,其特征在于,所述根据所述关键字创建所述病历对应的病历模板包括:
对所述类别中的每一子句中的关键字进行标注,得到多个初始模板;
对所述多个初始模板进行去重处理;
依据去重处理后的初始模板创建病历模板。
7.一种病历模板的创建装置,其特征在于,包括:
获取模块,用于获取病历对应的文本集合;
识别模块,用于针对所述文本集合中的每一文本,识别所述文本中与所述病历相关的关键字;
创建模块,用于根据所述关键字创建所述病历对应的病历模板。
8.根据权利要求7所述的装置,其特征在于,所述获取模块包括:
病历获取子模块,用于获取多个电子病历;
文本提取子模块,用于针对每一所述电子病历,从所述电子病历中提取目标文本;
集合组成模块,用于将提取到的所有目标文本组成病历对应的文本集合。
9.根据权利要求7所述的装置,其特征在于,所述识别模块包括:
第一拆分子模块,用于对所述文本进行语句拆分得到多个子句;
聚类子模块,用于对所述多个子句进行聚类,其中同一类别中的不同子句之间的编辑距离相似度大于预设阈值;
命名实体识别子模块,用于针对每一所述类别,对所述类别中的每一子句进行命名实体识别,得到与所述病历相关的关键字。
10.根据权利要求9所述的装置,其特征在于,所述第一拆分子模块包括:
第二拆分子模块,用于对所述文本进行语句拆分得到多个句子,并确定每一句子的所属字段;
第三拆分子模块,用于针对每一句子,依据与所述句子的所属字段对应的启发式规则,对所述句子进行拆分,得到多个子句,并为每一子句添加病历id和所属字段的字段名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京紫冬认知科技有限公司,未经北京紫冬认知科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910891498.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于打孔添加负磁致伸缩材料的电机降噪方法
- 下一篇:扬声器结构