[发明专利]一种基于时间划分的社交网络事件演化追踪方法无效
申请号: | 201910721933.2 | 申请日: | 2019-08-06 |
公开(公告)号: | CN110472105A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 费高雷;李建博;胡光岷 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06K9/62;G06Q50/00 |
代理公司: | 51268 成都虹盛汇泉专利代理有限公司 | 代理人: | 王伟<国际申请>=<国际公布>=<进入国 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 追踪 文本信息 信息技术领域 维特比算法 方法生成 焦点事件 起始事件 社交网络 社交网站 事件特征 演化关系 用户发布 终止事件 最优路径 求解 采集 应用 | ||
本发明公开一种基于时间划分的社交网络事件演化追踪方法,应用于信息技术领域,针对现有技术中演化追踪方法存在的追踪误差的问题;本发明首先从各社交网站中采集用户发布动态中的文本信息,并对文本信息进行事件特征提取;其次根据获取的事件得到若干事件演化关系,采用时间划分的方法生成事件演化图;然后根据关注的焦点事件,选取起始事件和终止事件;最后使用维特比算法求解到达每个事件的最优路径;相比于现有的方法,本发明的事件演化追踪效果更佳。
技术领域
本发明属于信息技术领域,特别涉及一种社交网络事件演化追踪技术。
背景技术
事件指在特定时间特定地点发生的特定事情。当前社交网络由于其便利性而受到了网络用户的广泛欢迎,因此现实生活中的很多事件都会在社交网络中有所反应。社交网络事件检测能够依据社交网络数据实时发现现实生活中的事件,对从社交网络中获取第一手的信息具有十分重要的作用。
事件演化(Event Evolution,EE)是指同一话题下的相关事件的传播发展过程。事件演化关系指的是两个事件之间的有向依赖关系。在生活中很多事件都有其发生、发展、结束等阶段,在各个阶段中又可能包含着一些子事件。因此,对于事件演化进行研究,对于一个事件的完整信息获取有着极其重要的作用。事件演化分析(Event Evolution Analysis,EEA)的目标是对话题下事件之间的关系进行刻画,构建事件关系模型进行演化分析事件演化关系的构建旨在充分利用事件的信息,刻画事件之间的演化关系。演化的含义包含了两方面的内容,一是时间上的先后顺序,即时序关系,主要用于确定演化方向;二是演化关系的强弱估计。
事件演化分析的相关研究主要包含事件演化关系构建和事件演化过程追踪两个方面。其中,事件演化关系构建通过对事件特征进行提取,得到演化关系的估计;事件演化过程追踪是根据事件的演化关系,利用演化图模型等方法对事件的发展过程进行追踪。事件演化图是事件演化分析的重要工具,现有的事件演化分析方法大多基于演化图模型来分析事件的演化过程。基于演化图模型的事件演化分析主要包括演化图生成和演化过程追踪两个步骤。事件演化图生成的目标是根据事件的演化相似度构建演化图中的有向边权值,最后形成完整的事件演化图。现有的事件演化图生成方法有两种,一种是按照事件发生时间的先后,根据时间窗口大小将事件序列划分为时间轴上的多个事件集,然后计算事件相似度,得到多阶段的图结构,另一种是根据时序关系构建所有事件之间的有向边,然后通过剪枝得到最终的演化图结构。事件演化过程追踪根据事件之间的演化关系,对事件的发展过程进行分析与追踪,从而得到事件的来龙去脉。现有的演化追踪方法包括故事线生成,最大生成树等方法。这些方法能够得到事件的发展过程的结构化表达,树状结构或链状结构。但是,目前缺少得到合理有效的演化过程的方法。因此,构建合理有效的演化过程是实现事件演化过程追踪的关键。
社交网络中的事件通常包含一定量的文本及文本对应的创建时间等信息,为了充分利用这些信息,需要对这些信息进行处理,进而使用处理后的信息构建演化关系。构建事件的演化过程会涉及到两方面的技术,一是事件特征提取,二是事件演化关系估计。
(1)事件特征提取
其中,提取事件的特征主要从“文本特征”、“时间特征”等方面进行提取。常用的文本特征提取方法包括词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)、信息增益、互信息等。本发明采用词频-逆文档频率进行事件文本特征抽取。词频-逆文档频率主要包含词频和逆文档频率两个要素。词频代表文本中的某个单词在文本中出现的频率。逆文档频率表示整个文档语料库中某个单词提供多少信息的一种度量方法,该度量指标能够反映某个单词在整个文档语料库中的分布情况。对于逆文档频率的计算,如果出现单词没有在文档中出现的情况,会导致分母为零的情形发生,因此通常使用平滑的方式进行处理。事件的时间特征指的是同事件文本相关的时间信息,包括事件文本创建时间、事件文本中出现的时间表达式等。通过对事件进行特征提取,可以判定不同事件之间的相似度,进而确定演化关系。
(2)事件演化关系估计
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910721933.2/2.html,转载请声明来源钻瓜专利网。