[发明专利]基于微博的事件特征演化挖掘方法及系统有效

专利信息
申请号: 201310532377.7 申请日: 2013-10-31
公开(公告)号: CN103631862B 公开(公告)日: 2017-01-11
发明(设计)人: 邓镭;贾焰;邹鹏;杨树强;周斌;韩伟红;李爱平;韩毅;李莎莎 申请(专利权)人: 中国人民解放军国防科学技术大学
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京泛华伟业知识产权代理有限公司11280 代理人: 王勇
地址: 410073 湖南省长沙*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 事件 特征 演化 挖掘 方法 系统
【权利要求书】:

1.一种基于微博的事件特征演化挖掘方法,包括以下步骤: 

步骤1,从与待分析事件相关的微博文本的集合中选取若干个代表事件起点的微博,以构成事件演化起点微博集合; 

步骤2,构造事件演化起点微博集合的图模型,作为初始的事件微观演化图;所述图模型中顶点为出现在该事件演化起点微博集合的各微博文本中的名词/动词,两个顶点间的边表示这两个顶点对应的词共同出现在同一微博中或共现距离小于预先给定的阈值; 

步骤3,对与待分析事件相关的微博文本的集合中其余各条微博,构建该条微博的图模型并将其加入到当前的事件演化微观图中; 

步骤4,基于经步骤3得到的事件微观演化图获取事件宏观演化图并基于事件宏观演化图观察事件特征的演化。 

2.根据权利要求1所述的方法,所述步骤1中代表事件起点的微博具有以下特征:a)发表时间早;b)为原创微博,而非转发或评论的微博。 

3.根据权利要求1所述的方法,所述步骤2中所述图模型的顶点以由该顶点对应的名词/动词,包含名词/动词的微博文档的集合,该名词/动词的倾向性评分构成的三元组来表示,其中该名词/动词的倾向性评分为修饰该名词/动词的形容词和副词所对应的倾向性评分的平均值。 

4.根据权利要求3所述的方法,所述步骤2包括: 

步骤2-1)对事件演化起点微博集合中每条微博文本进行分词和词性标注; 

步骤2-2)对分词后的形容词和副词,设置其倾向性评分; 

步骤2-3)对于分词后的名词和动词,将修饰同一名词/动词的形容词和副词所对应的倾向性评分取平均值,作为此名词或动词的倾向性评分; 

步骤2-4)以名词和动词作为顶点,如果任两个顶点对应的词共同出现在同一微博中或共现距离小于预先给定的阈值,则在这两个顶点之间创建边。 

5.根据权利要求1所述的方法,所述步骤3中将所构建的微博的图模型加入到当前的事件演化微观图包括:对待处理微博的图模型中的每一条边: 

a)若该边的两个顶点都已存在于当前的事件演化微观图中,且该事件演化微观图中已有此边,则对该边的出现次数计数进行累加;若该事件演化微观图中尚无此边,则将此边复制到该事件演化微观图中; 

b)若该边中有且只有一个顶点出现在当前的事件演化微观图中,则将不在该事件演化微观图中的顶点和边复制到该事件演化微观图中; 

c)若该边的两个顶点均不在当前的事件演化微观图中,则将此边和两个顶点完整复制到该事件演化微观图中。 

6.根据权利要求5所述的方法,所述步骤3还包括判断微博的图模型中某个顶点是否在事件演化微观图中的步骤,其包括:对于微博的图模型中给定的某个顶点,如果事件演化微观图中包含有与该顶点对应的词相同的顶点,该微博与对该事件演化微观图中对应顶点涉及的微博文本存在转发或评论的关系,并且这两个顶点的倾向性评分相容,则判定事件演化微观图中已包含该给定的顶点,其中,倾向性评分相容指事件演化微观图中对应顶点的倾向性评分与该给定的顶点倾向性评分的差小于一定阈值。 

7.根据权利要求1所述的方法,所述的步骤4)包括对事件微观演化图进行切分和转化以获取事件宏观演化图。 

8.根据权利要求7所述的方法,所述对事件微观演化图进行切分和转化包括: 

步骤4-1)将与待分析事件相关的微博文本按时间进行排序,对该微博文本序列按时间进行切片,形成所需粒度的时间片; 

步骤4-2)在事件宏观演化图中创建一个顶点,对应初始的事件微观演化图; 

步骤4-3)对于每一个时间片执行下列步骤: 

4-3-a)在事件微观演化图中依次选取每一个时间片对应的顶点和边,构造以此子图为基的最小连通子图; 

4-3-b)在事件宏观演化图中创建一个顶点,对应于该最小连通子图,若该最小连通子图与事件宏观演化图中其它顶点对应的子图相交,则创建一条连接两个子图的边。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310532377.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top