[发明专利]基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法无效
申请号: | 200910100750.5 | 申请日: | 2009-07-20 |
公开(公告)号: | CN101673280A | 公开(公告)日: | 2010-03-17 |
发明(设计)人: | 吴朝晖;夏超伦;姜晓红;吴敏萍;罗兆波;盛浩;刘森 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州裕阳专利事务所(普通合伙) | 代理人: | 张骁敏 |
地址: | 310027浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 恐怖袭击 事件 特征 挖掘 判定 组织 方法 | ||
技术领域
本发明涉及基于数据挖掘的犯罪特征分析技术领域,涉及犯罪特征分析中的恐怖袭击事件、恐怖组织特征挖掘分析,特别是涉及一种基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法。
背景技术
自911事件以来,各个国家的安全部门十分重视恐怖组织与恐怖袭击事件数据的搜集和相关数据库的建设,同时基于相关数据库在数据挖掘方面进行了一系列的研究。恐怖袭击事件数据的分析以及挖掘是从显性的数据入手,寻找出某些隐性的有用信息。从恐怖袭击事件数据中可能隐藏的特征、行为或者其他的因素来提炼出相关的模式,以此来提供线索、协助办案,同时,尽可能地把提取的特征模式用于监控之中,实现预警。
数据挖掘(Data Mining)旨在从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。还有很多和这一术语相近似的术语,如从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持等。于这些概念相提并论,是因为数据挖掘瞄准的对象是阐述个体间联系的相关性知识、而非描述个体属性、支零破碎的数据。
贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。应用贝叶斯网络分类器进行分类主要分成两阶段。第一阶段是贝叶斯网络分类器的学习,即从样本数据中构造分类器,包括结构学习和CPT学习;第二阶段是贝叶斯网络分类器的推理,即计算类结点的条件概率,对分类数据进行分类。
传统的朴素贝叶斯分类器在处理多数据分类时,需要逐条进行单数据分类,不能在分类之前对相似事件进行具体定性的分析,也不能对事件之间的关系进行分析。
发明内容
为了解决以上问题,本发明提供了一种成对分类的贝叶斯分类器,不仅利用了恐怖袭击本身所具有的特征属性,并且也利用了恐怖袭击之间的内在关系的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法。
一种基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,包括如下步骤:
1)根据已知恐怖袭击事件的属性训练贝叶斯分类器;2)计算未知恐怖袭击事件的相似度;3)选取相似度最大的2个恐怖袭击事件,并假设为同一恐怖组织发起;4)将步骤3)选出的2个恐怖袭击事件一起放入步骤1)训练好的贝叶斯分类器中,让贝叶斯分类器同时对这2个事件做出分类。
进一步的,所述步骤1)中的训练过程为:通过已知的训练数据,先获得每个恐怖组织的先验概率P(gi):
其中P(gi)表示某个被标记为gi的恐怖组织发起恐怖袭击的先验概率,其中Ngi为gi恐怖组织发起恐怖袭击的个数,NG表示训练样本中恐怖袭击的总个数。针对每个恐怖组织gi,计算一个关于5个属性的后验概率P(X1,...,X5|Y=gi),表示5个属性在恐怖组织gi所发起的所有恐怖袭击中的分布,X1,...,X5对应上文中5个属性量化后的取值。
进一步的,所述属性为:恐怖袭击日期、恐怖袭击类型、恐怖袭击地点、恐怖组织意识形态、恐怖袭击目标。
进一步的,所述步骤2)计算恐怖袭击事件之间的相似度采取以下公式:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910100750.5/2.html,转载请声明来源钻瓜专利网。