[发明专利]CDR系统中的患者数据匹配方法、主索引建立方法及装置在审
申请号: | 202111045885.3 | 申请日: | 2021-09-07 |
公开(公告)号: | CN113742348A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 刘新辉;张勇斌 | 申请(专利权)人: | 上海柯林布瑞信息技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2453;G06F16/2457 |
代理公司: | 上海思捷知识产权代理有限公司 31295 | 代理人: | 王宏婧 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | cdr 系统 中的 患者 数据 匹配 方法 索引 建立 装置 | ||
1.一种CDR系统中的患者数据匹配方法,其特征在于,包括:
获取待匹配数据和已确认数据,所述待匹配数据包含匹配字段,所述已确认数据包含所述匹配字段;
基于所述匹配字段的第i组合,依次获取所述待匹配数据和每一条所述已确认数据的第i相似度;
基于所有的所述第i相似度判断匹配是否成功,若成功,基于所有的所述第i相似度得到与所述待匹配数据相匹配的一条所述已确认数据;
其中,i的取值范围为1到n的所有整数,n为大于1的整数。
2.根据权利要求1所述的CDR系统中的患者数据匹配方法,其特征在于,基于所有的所述第i相似度判断匹配是否成功的步骤包括:若每一条所述已确认数据对应的所述第i相似度小于或者等于第i阈值,匹配失败;否则,匹配成功;
或者,
基于所有的所述第i相似度判断匹配是否成功的步骤包括:若每一条所述已确认数据对应的所有的所述第i相似度的总和小于预设阈值,匹配失败;否则,匹配成功。
3.根据权利要求2所述的CDR系统中的患者数据匹配方法,其特征在于,基于所有的所述第i相似度得到与所述待匹配数据相匹配的一条所述已确认数据的步骤包括:选择所有的所述第i相似度的总和最大的所述已确认数据。
4.根据权利要求2所述的CDR系统中的患者数据匹配方法,其特征在于,基于所有的所述第i相似度得到与所述待匹配数据相匹配的一条所述已确认数据的步骤包括:
若第i集合中存在至少一条所述已确认数据的所述第i相似度大于第i阈值且i小于n,所述第i集合中所述第i相似度大于所述第i阈值的所述已确认数据组成第i+1集合并重新判断;
否则,选择第i集合中的所有的所述第i相似度的总和最大的所述已确认数据,或者选择第i集合中的所述第i相似度最大的所述已确认数据;
其中,第1集合为所有所述已确认数据。
5.根据权利要求1~4中任一项所述的CDR系统中的患者数据匹配方法,其特征在于,获取所述待匹配数据和所述已确认数据的第i相似度的步骤包括:
依次获取第i组合中的每一个所述匹配字段对应的相似值,所述相似值基于第i加权参数加权平均后得到所述第i相似度。
6.根据权利要求5所述的CDR系统中的患者数据匹配方法,其特征在于,所述待匹配数据中每一个所述匹配字段仅存储一个属性值,所述已确认数据中每一个所述匹配字段存储一个或者两个以上的属性值;获取所述匹配字段对应的所述相似值的步骤包括:
所述待匹配数据中的属性值与所述已确认数据中对应的所述匹配字段中的每一个属性值进行相似性计算,计算结果加权平均后得到所述相似值。
7.根据权利要求5所述的CDR系统中的患者数据匹配方法,其特征在于,第1组合包括姓名字段、性别字段和身份证号码字段,所述身份证号码字段对应的所述第1加权参数大于0.5。
8.根据权利要求5所述的CDR系统中的患者数据匹配方法,其特征在于,所述匹配字段包括姓名字段,获取所述姓名字段对应的所述相似值的方法包括:按照如下公式计算:
其中,similarity表示所述相似值,EDAB表示A和B之间的编辑距离,max()表示取极大值运算,LA表示A的字符串长度,LB表示B的字符串长度,A表示所述待匹配数据中的所述姓名字段存储的属性值,B表示所述已确认数据中的所述姓名字段存储的属性值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海柯林布瑞信息技术有限公司,未经上海柯林布瑞信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111045885.3/1.html,转载请声明来源钻瓜专利网。