[发明专利]基于微博的事件特征演化挖掘方法及系统有效
申请号: | 201310532377.7 | 申请日: | 2013-10-31 |
公开(公告)号: | CN103631862B | 公开(公告)日: | 2017-01-11 |
发明(设计)人: | 邓镭;贾焰;邹鹏;杨树强;周斌;韩伟红;李爱平;韩毅;李莎莎 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇 |
地址: | 410073 湖南省长沙*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于微博的事件特征演化挖掘方法,包括:在微博时序序列中选取演化起始文档集,并在微博文档集合上基于词汇的共现特征构造文档的图模型以得到事件的知识网络结构;依据词汇的字面特征,词汇倾向性的相容性特征将微博图模型进行合并,构造事件特征的微观演化图;在事件的微观演化图上进行剪枝、切分和转化,形成事件特征的宏观演化图。该方法在挖掘事件特征的演化规律过程中采用了基于事件的知识网络的图挖掘方法,使得整个事件特征演化挖掘方法在知识的继承性方面得到提升,挖掘结果的可解释性更强。 | ||
搜索关键词: | 基于 事件 特征 演化 挖掘 方法 系统 | ||
【主权项】:
一种基于微博的事件特征演化挖掘方法,包括以下步骤:步骤1,从与待分析事件相关的微博文本的集合中选取若干个代表事件起点的微博,以构成事件演化起点微博集合,其中代表事件起点的微博具有以下特征:a)发表时间早;b)为原创微博,而非转发或评论的微博;步骤2,构造事件演化起点微博集合的图模型,作为初始的事件微观演化图;所述图模型中顶点为出现在该事件演化起点微博集合的各微博文本中的名词/动词,两个顶点间的边表示这两个顶点对应的词共同出现在同一微博中或共现距离小于预先给定的阈值;步骤3,对与待分析事件相关的微博文本的集合中其余各条微博,构建该条微博的图模型并将其加入到当前的事件演化微观图中;步骤4,对经步骤3得到的事件微观演化图进行切分和转化以获取事件宏观演化图并基于事件宏观演化图观察事件特征的演化;其中,所述步骤3中将所构建的微博的图模型加入到当前的事件演化微观图包括:对待处理微博的图模型中的每一条边:a)若该边的两个顶点都已存在于当前的事件演化微观图中,且该事件演化微观图中已有此边,则对该边的出现次数计数进行累加;若该事件演化微观图中尚无此边,则将此边复制到该事件演化微观图中;b)若该边中有且只有一个顶点出现在当前的事件演化微观图中,则将不在该事件演化微观图中的顶点和边复制到该事件演化微观图中;c)若该边的两个顶点均不在当前的事件演化微观图中,则将此边和两个顶点完整复制到该事件演化微观图中;其中,在所述步骤4中所述对事件微观演化图进行切分和转化包括:步骤4‑1)将与待分析事件相关的微博文本按时间进行排序,对该微博文本序列按时间进行切片,形成所需粒度的时间片;步骤4‑2)在事件宏观演化图中创建一个顶点,对应初始的事件微观演化图;步骤4‑3)对于每一个时间片执行下列步骤:4‑3‑a)在事件微观演化图中依次选取每一个时间片对应的顶点和边,构造以此子图为基的最小连通子图;4‑3‑b)在事件宏观演化图中创建一个顶点,对应于该最小连通子图,若该最小连通子图与事件宏观演化图中其它顶点对应的子图相交,则创建一条连接两个子图的边。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310532377.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种铸件细长盲孔风干机
- 下一篇:帮助下肢瘫痪者站起的充气围裙