[发明专利]一种智能警情督导处理系统及方法有效
申请号: | 201910465985.8 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110196977B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 文武;文勇;徐华彬;李昌席;朱昌业;兰腾;梁夏菲;何宁英 | 申请(专利权)人: | 广西南宁市博睿通软件技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/35;G06F16/33 |
代理公司: | 南宁智卓专利代理事务所(普通合伙) 45129 | 代理人: | 谭月萍;邓世江 |
地址: | 530007 广西壮族自治区南宁市高新区高新*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 督导 处理 系统 方法 | ||
1.一种智能警情督导处理系统,其特征在于,包括警情语义输入单元、警情训练生成模型单元、法律法规语义检索单元、警情分类检索单元和警情分类及处理法律集显示单元,所述警情语义输入单元与警情训练生成模型单元连接,所述警情训练生成模型单元分别与法律法规语义检索单元和警情分类检索单元连接,所述警情分类及处理法律集显示单元分别与法律法规语义检索单元和警情分类检索单元的输出端连接,所述警情语义输入单元用于供接警电话输入警情语义,并提取警情语义中的定长字符输入警情训练生成模型单元和法律法规语义检索单元,所述警情训练生成模型单元用于把增广数据输入到深度神经网络模型进行训练,生成相关的表示语义句子向量模型和警情分类模型,句子向量模型对警情语义中的定长字符进行句向量处理得到警情语义句向量,警情分类模型对警情语义中的定长字符进行警情分类处理得到警情分类关键字,所述法律法规语义检索单元用于采用句子向量模型获取法律法规的句向量集S,并存在在数据资料库中,将警情语义句向量通过局部敏感hash函数或向量夹角余弦度量对比句向量集S,获取距离小于d的法规集R,所述警情分类检索单元用于警情分类类别作为关键字,检索出数据中相关的出警流程,所述警情分类及处理法律集显示单元用于通过网络协议推送警情分类和法规定集R到执法终端显示,实现处警的规范化;
所述警情训练生成模型单元包括神经网络训练模型模块、句子向量模型生成模块和警情分类模型模块,所述神经网络训练模型模块分别与句子向量模型生成模块和警情分类模型模块连接,所述神经网络训练模型模块用于以增广数据为输入进行训练生成句子向量模型生成模块和警情分类模型模块,所述句子向量模型生成模块用于对警情语义中的定长字符进行句向量处理得到警情语义句向量,所述警情分类模型模块用于对警情语义中的定长字符进行警情分类处理得到警情分类关键字;
所述法律法规语义检索单元包括句向量编码生成模块和法律法规语义对比模块,所述句向量编码生成模块和法律法规语义对比模块连接,所述句向量编码生成模块对句向量进行编码生成具有由编码序号的句向量,所述法律法规语义对比模块根据编码序号的句向量进行输入与《中华人民共和国刑法》中的每条法律法规进行对比生成句向量集S,并存在在数据资料库中;
所述警情分类检索单元包括警情分类存储模块和警情流程检索模块,所述警情分类存储模块与警情流程检索模块连接,所述警情分类存储模块用于汇总警情分类类别的关键字,所述警情流程检索模块用于根据关键字检索出相关的出警流程;
上述一种智能警情督导处理系统的方法,所述方法包括如下步骤:
步骤1:生成警情领域同义词表;
步骤2:生成公安领域警情语料增广数据;
步骤3:把增广数据输入神经网络模型进行训练,生成相关的表示语义句子向量模型和警情分类模型;
步骤4:接警人员通过警情语义输入单元输入警情语义,并根据同义词表提取警情语义中的定长字符;
步骤5:把警情语义中的定长字符输入句子向量模型和警情分类模型取得表示该警情语义句向量和警情分类类别;
步骤6:获取的警情分类类别作为关键字,检索出数据中相关的处警流程;
步骤7:使用句子向量模型获取《中华人民共和国刑法》每条法规的句向量集S,并存在在数据资料库中;
步骤8:把生成的警情语义句向量通过局部敏感hash函数或向量夹角余弦度量对比句向量集S,获取距离小于d的法规集R;
步骤9:通过网络协议推送警情分类和法规定集R到执法终端,实现处警的规范化;
所述步骤1的具体过程为:
步骤1.1:通过互联网获取公开的《中华人民共和国刑法》基本文本语料集D;
步骤1.2:使用分词工具对语料集D进行分词,全用尺寸为3,步长为1窗口获得二元语言学训练数据;
步骤1.3:将二元语言学训练数据进行Word2Vec模型训练得到词向量表示;
步骤1.4:计算每两个词向量vi,vj间的夹角余值作为两个词的相似度,获得相似度量矩阵;
步骤1.5:通过度量获取与词vi最邻近的3个词即vi的3个同义词得到警情领域的同义词表;
所述步骤2的具体过程为:
步骤2.1:输入一条警情语料,判断该类语料数量n是否大于等于100条;
步骤2.2:如果n小于100,直接采样输出该语料,如果n大于等于100执行下一步;
步骤2.3:对输入的语料进行分词,获得该语料情的分词表;
步骤2.4:等概率生成[0,1,2,3,4]中的一个随机变量N,如N=0采用同义词替换法该语料情的分词表中的3个单词生成新语料;如N=1在句子中找到一个随机词的随机同义词,将该同义词插入句子中的随机位置生成新语料;如N=2随机选择分词表里的两个单词交换位置生成新语料;如N=3随机删除分词表中的1个单词生成新语料;如N=4直接输出该语料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西南宁市博睿通软件技术有限公司,未经广西南宁市博睿通软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910465985.8/1.html,转载请声明来源钻瓜专利网。