[发明专利]一种警情的自动分类与预测方法在审
申请号: | 201911021249.X | 申请日: | 2019-10-25 |
公开(公告)号: | CN110837601A | 公开(公告)日: | 2020-02-25 |
发明(设计)人: | 赵粉玉;田远东;鲁立虹;张慧娟;赵伯亮 | 申请(专利权)人: | 杭州叙简科技股份有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06Q10/04;G06Q50/26 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 310012 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 分类 预测 方法 | ||
1.一种警情的自动分类与预测方法,其特征在于,接收单条警情数据输入,通过警情分类系统,返回警情类型;
警情分类系统包括:警情数据模块(1),关键词获取和筛选模块(2),犯罪类型统计筛选模块(3),警情类型评估统计(4),警情类型近义词模块(5),警情类型相似词模块(6),警情数据类型关联模块(7),警情分类模型训练模块(8);
警情数据模块(1),是所有警情数据的集合;
关键词获取和筛选模块(2),是用来获取警情数据中的关键词,根据实际情况剔除噪音词后规范化后形成警情类别;
犯罪类型统计筛选模块(3)是根据刑法罪名以及治安案件类型作为参考对警情类型做相应补充;
警情类型评估统计(4)是在得到关键词集合后,整理出如纠纷、被盗、闹事、丢失、扰民等,名词根据修饰词再做详细区分,然后将其它词根据治安法案件类型、刑法案件类型或案件命名规则对其进行同义替换;
根据具体情况将警情类型聚类,训练模型时标签使用聚类后的警情类型,训练后通过句式分析再得到其具体的类型;
警情数据类型关联模块(7)是根据警情类别对警情训练样本设置标签,形成语料集(X,Y),X为特征即警情数据,Y为标签即警情类型;
警情类型近义词模块(5)是获取每类警情关键词的近义词,近义词通过相似词林或词典获取;
警情类型相似词模块(6)是获取每类警情关键词的相似词,下载维基百科语料,语料通过jieba分词将并去除停用词,使用word2vec工具将处理好的词汇映射成n维的向量,再通过向量间余弦相似度评估词之间的相似程度;
警情数据类型关联模块(7)将警情类别的相关词、近义词作为关键词群后,通过模糊匹配方式得到一批有标签的数据,其中匹配方式为多词或单词模式;
警情分类模型训练模块(8)是训练一种基于textCNN的警情分类模型。
2.根据权利要求1中所述的一种警情的自动分类与预测方法,其特征在于,关键词获取和筛选模块(2)的具体方法如下:
步骤(1.1)、将原数据拆分成词组,对词语数组的进行词性标注;
步骤(1.2)、每个词组过滤掉停用词,最终只保留词性为名词、动词的单词;
步骤(1.3)、将所有结果整合得到单词的集合;
步骤(1.4)、构建词图G=(v,e),其中V为节点集合,由以上步骤生成的词组成,然后采用共现关系构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K的窗口中共现,e为上述边的集合,K表示窗口大小;最后通过TextRank迭代算法公式计算各节点的权重,直至收敛,最终不同词语会有不同的权重值,权重值高的的词语为关键词;
TextRank迭代算法计算公式为:
WS(Vi)是词语i的权重值;d是阻尼系数,取值范围为0到1,代表从图中某一特定点指向其他任意点的概率,一般设置为0.85;In(Vi)是存在指向词语i的链接的词语集合;
Out(Vj)是词语j中的链接存在的链接指向的词语的集合;权重项ωji,用来表示两个词语之间的边有不同的重要程度;
步骤(1.5)、根据关键词的词频过滤掉词频统计值DF小于阀值(如DFM取值20)的值以及噪音词。
3.根据权利要求1中所述的一种警情的自动分类与预测方法,其特征在于,警情分类模型训练模块(8)的具体方法如下:
步骤(2.1)、文本的预处理,样本分词后去除无意义的符号信息、地址、数字、停用词等冗余信息;
步骤(2.2)、文本数值化:使用word2vec工具获取特征集的词向量模型,将文本数据向量化;
步骤(2.3)、输入样本的向量化数据,使用深度学习模型Text-CNN模型进行分类训练,即通过卷积层提取语句的特征,将提取的特征输入到分类器中进行分类;
步骤(2.4)、根据结果调整参数,保存最终模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州叙简科技股份有限公司,未经杭州叙简科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911021249.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电连接器
- 下一篇:基于模型选择的地下电缆故障修复方法和装置