[发明专利]一种重复案件查找方法和装置、计算机可读存储介质有效
申请号: | 201910325367.3 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110110325B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 王一淏 | 申请(专利权)人: | 北京明智和术科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/33;G06Q50/18 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 陶丽;栗若木 |
地址: | 100124 北京市朝阳区高碑店乡高碑店村民*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种重复案件查找方法和装置、计算机可读存储介质,所述方法包括获取多个案件的案情描述文本集,所述案情描述文本集包括案件编码信息和案情描述信息,所述案情描述信息包括以下一种或多种信息:参与人、发生日期;对案情描述文本集进行局部敏感哈希算法处理,得到相似度大于或等于预设相似度阈值的一个或多个案件集合,并对得到的案件集合进行合并处理,使得合并后的案件集合之间无交集;剔除合并后的案件集合中与其他案件没有相同参与人和/或发生日期不同的案件,得到一个或多个重复案件集合。本申请通过局部敏感哈希算法处理以及参与人和发生日期比较,去除了案件集合中的错误数据,保障了高相似案件中同一案件识别的精准度。 | ||
搜索关键词: | 一种 重复 案件 查找 方法 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种重复案件查找方法,其特征在于,包括:获取多个案件的案情描述文本集,所述案情描述文本集包括案件编码信息和案情描述信息,所述案情描述信息包括以下一种或多种信息:参与人、发生日期;对所述案情描述文本集进行局部敏感哈希算法处理,得到相似度大于或等于预设相似度阈值的一个或多个案件集合,并对得到的案件集合进行合并处理,使得合并后的案件集合之间无交集;剔除所述合并后的案件集合中与其他案件没有相同参与人和/或发生日期不同的案件,得到一个或多个重复案件集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明智和术科技有限公司,未经北京明智和术科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910325367.3/,转载请声明来源钻瓜专利网。