[发明专利]涉网犯罪防控方法、装置、计算机设备及存储介质有效
申请号: | 202010738475.6 | 申请日: | 2020-07-28 |
公开(公告)号: | CN112069392B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 丁伟杰;李海军;傅团结;陈立力;李保敏;沈旭晨;郑滋椀 | 申请(专利权)人: | 浙江警察学院 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/295;G06F40/30;G06F16/36;G06F16/35;G06K9/62;G06N3/04;G06N3/08;H04L29/08;G06Q50/26 |
代理公司: | 杭州知学知识产权代理事务所(普通合伙) 33356 | 代理人: | 张雯 |
地址: | 310053 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 犯罪 方法 装置 计算机 设备 存储 介质 | ||
1.涉网犯罪防控方法,其特征在于,包括:
获取需要分析的犯罪案件信息,以得到初始数据;
将所述初始数据输入至案件分类模型内进行案件分类处理,以得到分类结果;
判断所述分类结果是否是涉网新型犯罪案件;
若所述分类结果是涉网新型犯罪案件,则将初始数据输入至要素提取模型内进行关键要素提取,以得到关键信息;
根据所述关键信息生成知识图谱;
根据所述知识图谱生成防控信息,并将所述防控信息推送至对应的终端;
其中,所述案件分类模型是通过带有案件类别标签的犯罪案件信息作为第一样本数据集训练文本分类模型所得的;
所述要素提取模型是通过带有关键信息位置标签的犯罪案件信息作为第二样本数据集训练命名实体识别模型所得的,具体包括:
构建命名实体识别模型,并进行预训练;
获取若干个涉网犯罪案件信息,并对涉网犯罪案件信息的关键信息进行位置标签的标注,以得到第二样本数据集;
根据第二样本数据集对命名实体识别模型进行微调,以得到微调后的命名实体识别模型;
将所有涉网犯罪案件信息作为测试数据集,使用微调后的命名实体识别模型对测试数据集进行预测,以得到预测结果;
判断预测结果是否符合要求;
若预测结果符合要求,则微调后的命名实体识别模型为要素提取模型;
若预测结果不符合要求,则执行所述根据第二样本数据集对命名实体识别模型进行微调,以得到微调后的命名实体识别模型;
所述根据第二样本数据集对命名实体识别模型进行微调,以得到微调后的命名实体识别模型,包括:
将第二样本数据集输入至命名实体识别模型内进行语义计算,以得到语义信息;
对语义信息使用非线性映射方式计算每个字作为实体的起始位置和终止位置的概率,以得到概率集合;
筛选概率集合中超过设定阈值的概率所对应的位置索引,以得到位置结果;
根据位置结果以及对应的关键信息位置标签计算交叉熵损失函数值,通过损失函数值进行反向传播微调命名实体识别模型的参数,以得到微调后的命名实体识别模型。
2.根据权利要求1所述的涉网犯罪防控方法,其特征在于,所述根据所述关键信息生成知识图谱之后,还包括:
建立涉网犯罪案件的采集标准;
根据采集标准采集相关的涉网犯罪信息,以更新知识图谱。
3.根据权利要求2所述的涉网犯罪防控方法,其特征在于,所述案件分类模型是通过带有案件类别标签的犯罪案件信息作为第一样本数据集训练文本分类模型所得的,包括:
构建文本分类模型,并进行预训练;
获取若干个涉网犯罪案件信息以及若干个非涉网犯罪案件信息,并对涉网犯罪案件信息以及非涉网犯罪案件信息对应的案件类别标签,以得到第一样本数据集;
将第一样本数据集划分为第一训练集以及第一测试集;
根据第一训练集对文本分类模型进行微调,以得到微调后的文本分类模型;
使用微调后的文本分类模型对第一测试集进行预测,以得到测试结果;
判断测试结果是否符合要求;
若测试结果符合要求,则微调后的文本分类模型为案件分类模型;
若测试结果不符合要求,则执行所述根据第一训练集对文本分类模型进行微调,以得到微调后的文本分类模型。
4.根据权利要求3所述的涉网犯罪防控方法,其特征在于,所述根据第一训练集对文本分类模型进行微调,以得到微调后的文本分类模型,包括:
将第一训练集输入至文本分类模型内进行计算,以得到样本的语义向量;
使用全连接层对样本的语义向量计算涉网新型犯罪案件类别以及非涉网新型犯罪案件类别所对应的语义特征,以得到特征值;
根据特征值计算涉网新型犯罪案件类别以及非涉网新型犯罪案件类别对应的概率,以得到训练结果;
根据训练结果以及对应的案件类别标签计算交叉熵损失函数值,通过损失函数值进行反向传播微调文本分类模型的参数,以得到微调后的文本分类模型。
5.根据权利要求1所述的涉网犯罪防控方法,其特征在于,所述文本分类模型包括通用预训练语言表示模型、神经网络模型以及非神经网络中至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江警察学院,未经浙江警察学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010738475.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:线控底盘加工治具
- 下一篇:涉网犯罪分类方法、装置、计算机设备及存储介质