[发明专利]基于警情间语义相似度判断串并案的方法及装置在审
申请号: | 202110678907.3 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113297834A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 石庭豪;李明洹;陈耀玲 | 申请(专利权)人: | 苏州智汇谷科技服务有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06K9/62;G06F40/30;G06Q50/26 |
代理公司: | 南京科知维创知识产权代理有限责任公司 32270 | 代理人: | 梁珺 |
地址: | 215000 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 警情间 语义 相似 判断 方法 装置 | ||
本发明实施例提供了一种基于警情间语义相似度判断串并案的方法及装置,该方法包括借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;利用公安警情词向量,计算警情之间的相似度;将所述相似度大于第一阈值的多个警情辅助判断为串并案。
技术领域
本发明涉及公安管理领域,特别是涉及一种基于警情间语义相似度判断串并案的方法及装置。
背景技术
在公安的案件,有串案和并案两种叫法。串案,就是一系列不同的案件,通过对作案手段、痕迹、物证等分析,发现其存在联系,进而将这些案件放在一起侦破。并案,是指两个不同的案件,通过作案手段、痕迹、物证,发现其存在联系,而将两个案件放在一起侦破。
现有技术中对串案和并案的处理方式,是通过人的经验来对作案手段、痕迹、物证等已有的数据进行分析,来确定案件之间是否串案或并案处理。其缺点是,串案和并案全部依赖的是个人的经验,没有系统支撑,另外面对海量的警情,很难有效的找到串并案警情,并且存在一定错误率。
发明内容
本发明的目的是克服现有技术中的不足之处,提供一种基于警情间语义相似度判断串并案的方法及装置。
为实现上述目的,本发明一方面提供一种基于警情间的语义相似度辅助判断串并案的方法,包括:
借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;
利用公安警情词向量,计算警情之间的相似度;
将所述相似度大于第一阈值的多个警情辅助判断为串并案。
优选地,所述利用公安警情词向量,计算警情之间的相似度包括:
使用余弦相似度,计算警情的公安警情词向量之间的相似度,确定警情之间的相似度。
本发明另一方面还提供一种基于综合相似度辅助判断串并案的方法,包括:
基于警情间的融合路径权重相似度计算警情间的第一类型相似度;
基于警情间的语义相似度计算警情间的第二类型相似度;
基于专家规则计算警情间的第三类型相似度;
基于第一类型相似度、第二类型相似度和第三类型相似度,辅助判断警情之间是否为串并案;
其中,基于警情间的语义相似度计算警情间的第二类型相似度包括:
借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;利用公安警情词向量,计算警情之间的第二类型相似度。
本发明再一方面还提供一种计算机,包括处理器和存储器,所述处理器用于执行存储器中存储的指令以执行如下步骤:
借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;
利用公安警情词向量,计算警情之间的相似度;
将所述相似度大于第一阈值的多个警情辅助判断为串并案。
本发明再一方面还提供一种计算机,包括处理器和存储器,所述处理器用于执行存储器中存储的指令以执行如下步骤:
基于警情间的融合路径权重相似度计算警情间的第一类型相似度;
基于警情间的语义相似度计算警情间的第二类型相似度;
基于专家规则计算警情间的第三类型相似度;
基于第一类型相似度、第二类型相似度和第三类型相似度,辅助判断警情之间是否为串并案;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州智汇谷科技服务有限公司,未经苏州智汇谷科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110678907.3/2.html,转载请声明来源钻瓜专利网。