[发明专利]一种警情的自动分类与预测方法在审

专利信息
申请号: 201911021249.X 申请日: 2019-10-25
公开(公告)号: CN110837601A 公开(公告)日: 2020-02-25
发明(设计)人: 赵粉玉;田远东;鲁立虹;张慧娟;赵伯亮 申请(专利权)人: 杭州叙简科技股份有限公司
主分类号: G06F16/9536 分类号: G06F16/9536;G06K9/62;G06Q10/04;G06Q50/26
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 310012 浙江省杭州市余杭区*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动 分类 预测 方法
【权利要求书】:

1.一种警情的自动分类与预测方法,其特征在于,接收单条警情数据输入,通过警情分类系统,返回警情类型;

警情分类系统包括:警情数据模块(1),关键词获取和筛选模块(2),犯罪类型统计筛选模块(3),警情类型评估统计(4),警情类型近义词模块(5),警情类型相似词模块(6),警情数据类型关联模块(7),警情分类模型训练模块(8);

警情数据模块(1),是所有警情数据的集合;

关键词获取和筛选模块(2),是用来获取警情数据中的关键词,根据实际情况剔除噪音词后规范化后形成警情类别;

犯罪类型统计筛选模块(3)是根据刑法罪名以及治安案件类型作为参考对警情类型做相应补充;

警情类型评估统计(4)是在得到关键词集合后,整理出如纠纷、被盗、闹事、丢失、扰民等,名词根据修饰词再做详细区分,然后将其它词根据治安法案件类型、刑法案件类型或案件命名规则对其进行同义替换;

根据具体情况将警情类型聚类,训练模型时标签使用聚类后的警情类型,训练后通过句式分析再得到其具体的类型;

警情数据类型关联模块(7)是根据警情类别对警情训练样本设置标签,形成语料集(X,Y),X为特征即警情数据,Y为标签即警情类型;

警情类型近义词模块(5)是获取每类警情关键词的近义词,近义词通过相似词林或词典获取;

警情类型相似词模块(6)是获取每类警情关键词的相似词,下载维基百科语料,语料通过jieba分词将并去除停用词,使用word2vec工具将处理好的词汇映射成n维的向量,再通过向量间余弦相似度评估词之间的相似程度;

警情数据类型关联模块(7)将警情类别的相关词、近义词作为关键词群后,通过模糊匹配方式得到一批有标签的数据,其中匹配方式为多词或单词模式;

警情分类模型训练模块(8)是训练一种基于textCNN的警情分类模型。

2.根据权利要求1中所述的一种警情的自动分类与预测方法,其特征在于,关键词获取和筛选模块(2)的具体方法如下:

步骤(1.1)、将原数据拆分成词组,对词语数组的进行词性标注;

步骤(1.2)、每个词组过滤掉停用词,最终只保留词性为名词、动词的单词;

步骤(1.3)、将所有结果整合得到单词的集合;

步骤(1.4)、构建词图G=(v,e),其中V为节点集合,由以上步骤生成的词组成,然后采用共现关系构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K的窗口中共现,e为上述边的集合,K表示窗口大小;最后通过TextRank迭代算法公式计算各节点的权重,直至收敛,最终不同词语会有不同的权重值,权重值高的的词语为关键词;

TextRank迭代算法计算公式为:

WS(Vi)是词语i的权重值;d是阻尼系数,取值范围为0到1,代表从图中某一特定点指向其他任意点的概率,一般设置为0.85;In(Vi)是存在指向词语i的链接的词语集合;

Out(Vj)是词语j中的链接存在的链接指向的词语的集合;权重项ωji,用来表示两个词语之间的边有不同的重要程度;

步骤(1.5)、根据关键词的词频过滤掉词频统计值DF小于阀值(如DFM取值20)的值以及噪音词。

3.根据权利要求1中所述的一种警情的自动分类与预测方法,其特征在于,警情分类模型训练模块(8)的具体方法如下:

步骤(2.1)、文本的预处理,样本分词后去除无意义的符号信息、地址、数字、停用词等冗余信息;

步骤(2.2)、文本数值化:使用word2vec工具获取特征集的词向量模型,将文本数据向量化;

步骤(2.3)、输入样本的向量化数据,使用深度学习模型Text-CNN模型进行分类训练,即通过卷积层提取语句的特征,将提取的特征输入到分类器中进行分类;

步骤(2.4)、根据结果调整参数,保存最终模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州叙简科技股份有限公司,未经杭州叙简科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911021249.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top