[发明专利]一种基于结构化电子病历的查重方法在审
申请号: | 201710056734.5 | 申请日: | 2017-01-25 |
公开(公告)号: | CN106844311A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 王兴强 | 申请(专利权)人: | 济南德健信息技术有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250000 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 电子 病历 方法 | ||
1.一种基于结构化电子病历的查重方法,其特征在于,它包括文档模板查重属性、文档段查重属性和最小相似比KMP字符串匹配算法。
2.如权利要求1所述的基于结构化电子病历的查重方法,其特征在于,文档模板查重属性,即电子病历的文档模板类型具有支持查重的属性。
3.如权利要求1所述的基于结构化电子病历的查重方法,其特征在于,文档段查重属性,即电子病历的文档模板类型中文档段具有支持查重的属性。
4.如权利要求1所述的基于结构化电子病历的查重方法,其特征在于,最小相似比KMP字符串匹配算法,即在KMP字符串匹配算法基础上,增加最小相似比系数C,当匹配目标字符串超过1-C比例时,退出匹配,其步骤如下:
1)在目标串S和模式串T中分别设比较的起始下标i和j,初始化最小相似比系数C,C的取值范围为0到1;
2)计算目标串S和模式串T的长度LS和LT;
3)采用KMP算法计算模式串T的前缀数组next[j];
4)如果目标串S没有比较完i<LS或模式串T没有比较完j<LT,跳到步骤5),否则跳到步骤9);
5)如果S[i]=T[j],跳到步骤6),否则跳到步骤7);
6)目标串S和模式串T的比较下标都下移一位,即i加1,j加1,跳到步骤4);
7)如果目标串S未比较部分小于最小相似长度,即LS-i<LS*C,跳到步骤9),否则跳到步骤8);
8)模式串T的比较下标j跳至next[j],即j=next[j],跳到步骤4);
9)结束。
5.如权利要求1所述的基于结构化电子病历的查重方法,其特征在于,步骤如下:
1)开始;
2)检索患者结构化电子病历的文件列表;
3)逐条读取病历文件列表,如果读取完毕跳到步骤10);
4)判断病历文件的文档模板查重属性,如果支持查重,跳到步骤5),否则跳到步骤3);
5)检索文档模板类型的文档段列表;
6)逐条读取文档段列表,如果读取完毕跳到步骤3);
7)判断文档段查重属性,如果支持查重,跳到步骤8),否则跳到步骤6);
8)检索文档段中的结构化绑定对象;
9)加载病历文件的相应文档段的文本至待查重对象列表,并去除结构化绑定对象的部分,跳到步骤6);
10)采用最小相似比KMP字符串匹配算法,对待查重对象列表中的文本,进行查重;
11)结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南德健信息技术有限公司,未经济南德健信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710056734.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种含导电无纺布底膜的PET膜的撕膜设备
- 下一篇:一种挤膏器