[发明专利]基于流式图模型的社交网络突发事件检测方法有效
申请号: | 201510061279.9 | 申请日: | 2015-02-05 |
公开(公告)号: | CN104598629B | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 李建欣;于伟仁;张日崇;怀进鹏;卢忠宇 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司11205 | 代理人: | 马爽,黄健 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于流式图模型的社交网络突发事件检测方法,包括依次对每个数据文本进行分词处理得到由每个数据文本中的关键词作为节点,关键词间的共现关系作为边的关键词共现图;根据到达当前检测时刻时关键图共现图中每条边每个到来时刻的出现次数以及每条边的每个到来时刻对应的衰减权重,确定每条边的边频率;根据与各邻节点间边的边频率确定各节点的节点活动频率;确定各节点的活动频率变化程度并根据活动频率变化程度确定突发热词节点,得到突发热词共现图;对突发热词共现图进行预设图聚类算法处理,得到各突发事件。基于流式图的关键词共现图进行突发热词检测,进而检测突发事件,保证了突发事件检测结果的准确实时。 | ||
搜索关键词: | 基于 流式图 模型 社交 网络 突发事件 检测 方法 | ||
【主权项】:
一种基于流式图模型的社交网络突发事件检测方法,其特征在于,包括:依次获取待处理数据,所述待处理数据中包括至少一个数据文本;依次对所述至少一个数据文本中的每个数据文本进行分词处理,得到由每个数据文本中包含的关键词作为节点,每个数据文本中的所述关键词间的共现关系作为边的关键词共现图,其中,所述共现关系是指所述关键词同时出现在同一个数据文本中,存在共现关系的关键词间都存在连接边;根据到达当前检测时刻时所述关键词共现图中每条边每个到来时刻的出现次数以及所述每条边的每个到来时刻对应的衰减权重,确定当前检测时刻所述每条边的边频率;确定所述关键词共现图中的每个节点的邻节点集合,并根据分别与所述邻节点集合中的每个邻节点间边的边频率,确定当前检测时刻所述每个节点的节点活动频率;根据每个节点在不同检测时刻对应的节点活动频率,确定每个节点的活动频率变化程度;确定所述关键词共现图中节点的活动频率变化程度大于预设程度阈值的节点为突发热词节点,与所述突发热词节点存在共现关系的节点为所述突发热词节点的共现词节点,得到由各突发热词节点和各突发热词节点分别对应的共现词节点,以及各突发热词节点与各突发热词节点分别对应的共现词节点间的边组成的突发热词共现图;对所述突发热词共现图进行预设图聚类算法处理,得到各个聚类结果,每个聚类结果中包含的关键词节点构成一个突发事件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510061279.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理方法和装置
- 下一篇:一种完全装配的快速接头