[发明专利]基于大数据的缉私案件情报抽取方法在审
申请号: | 202010263448.8 | 申请日: | 2020-04-07 |
公开(公告)号: | CN111476027A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 邱明月;吴育宝;王新猛 | 申请(专利权)人: | 南京森林警察学院 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06N3/04;G06N3/08;G06Q50/26 |
代理公司: | 江苏吾索律师事务所 32337 | 代理人: | 曾昭昱 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 缉私 案件 情报 抽取 方法 | ||
本发明公开了基于大数据的缉私案件情报抽取方法,提出了面向大数据的缉私信息抽取模型,并对该模型在真实案件复盘中的具体应用效果进行验证。首先基于缉私案件信息,构建缉私案件的情报要素表达模型;然后通过自然语言处理技术和深度学习算法模型,实现各类缉私情报要素的自动抽取;最后结合单据链、资金链和货物链证据链条,实现大数据环境下智能化的缉私情报抽取效果验证。本发明通过借鉴要素模型、自然语言处理技术,以缉私案件相关的信息为数据源,构建大数据环境下的缉私情报抽取模型,形成一种缉私案件情报自动抽取的缉私情报服务方法,并开展实验验证分析,实现了情报自动抽取,有效节省了人力物力的投入。
技术领域
本发明属于基于计算模型的数据处理技术领域,具体涉及一种基于大数据的缉私案件情报抽取方法。
背景技术
在大数据时代背景下,不法分子在进行走私违法犯罪活动的过程中应用的信息化手段也越来越多,交易的相关信息被存储在各种各样的媒体和介质中,具有数据量大,且被隐蔽于不同领域存储器中的特点。具体的数据来源主要包括海关业务数据、公安内部数据、其他行政管理数据和互联网资源。
走私犯罪行为普遍会涉及报关单证、运单、舱单、提单和销售合同等文本信息材料,还有走私犯罪分子的基本人员信息、通话记录、资金来往以及相关的线索信息。面对这种长时间跨度的各种数据类型的案件海量复杂信息,海关缉私警察必须从相关材料中快速高效地抽取出与案件有关的有效情报,以及时整理出案件的资金流、货物流、单证流等证据链条,达到帮助迅速梳理案情助力破案的目的。这其中的每一个环节都对大数据时代海关缉私情报的抽取能力提出了硬性要求,对于传统缉私情报工作而言,情报抽取已经构成瓶颈。
基于以上分析,有必要构建面向大数据技术背景下的可适用于多层次、广视角的大量缉私案件数据研究的缉私案件情报抽取方法。
发明内容
本发明针对海关传统缉私情报工作存在的情报抽取瓶颈问题,提出了面向大数据的缉私信息抽取模型,并对该模型在真实案件复盘中的具体应用效果进行验证。
为实现上述目的,本发明采用的技术方案为基于大数据的缉私案件情报抽取方法,包含以下步骤:
S1:基于缉私案件信息,构建缉私案件的情报要素表达模型;
S2:通过自然语言处理技术和深度学习算法模型,实现各类缉私情报要素的自动抽取;
S3:结合单据链、资金链和货物链证据链条,实现大数据环境下智能化的缉私情报抽取效果验证。
上述步骤S1又具体包括以下步骤:
S11:缉私案件的要素表达
基于缉私案件的案件特征,数据来源,构建缉私案件的要素表达模型。
S12:字符向量化
参照上述要素表达模型的组成及其关系,对缉私案事件文本进行情报的要素标注,得到已标注数据集,基于已标注训练集及未标注的案件文本语料,利用产生词向量的相关模型工具对分好词的文本进行无监督训练学习。
作为优选,上述产生词向量的相关模型工具使用的是word2vec,用来训练以重新建构语言学之词文本。
上述步骤S2中所述深度学习算法模型的建模流程具体包括以下步骤:
S21:扩张卷积
将卷积神经网络层应用到序列标注问题,对序列向量进行卷积运算,对输入序列做仿射变换,对于其子序列向量xt的输出,其定义为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京森林警察学院,未经南京森林警察学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010263448.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置