[发明专利]一种论坛事件传播图的构建装置及构建方法无效
申请号: | 201010133617.2 | 申请日: | 2010-03-29 |
公开(公告)号: | CN101819585A | 公开(公告)日: | 2010-09-01 |
发明(设计)人: | 王巍;杨武;苘大鹏;赵慧杰 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 论坛 事件 传播 构建 装置 方法 | ||
技术领域
本发明涉及利用计算机技术辅助网络信息智能分析或舆情管理的技术,其特别涉及利用自然语言处理和数据挖掘技术来发现论坛上热点事件的传播、扩散过程的装置和方法。
背景技术
BBS已经成为网民发表观点和交流思想的平台。由于BBS具有的匿名性、开放性、互动性等特点,使得网民可以自由的发表意见,同时,BBS的广泛应用,给舆情管理和监督带来了新的挑战。BBS信息传播的迅速往往使得信息变得不可控制,一个事件经过网民的转载、传播,便会在网络上迅速扩散,最终可能爆发舆论,因此需要对热点事件的传播过程实时地发现和跟踪,及时了掌握事件发展的最新动向,从而更好地进行网络舆情监控。发现论坛之间热点事件传播过程是通过对目标论坛信息的自动抓取、主题检测来发现热点事件在不同论坛之间的传播过程,达到对网络热点事件实施准确监控和分析其来源的目的。论坛之间热点事件传播过程发现的基本思路是采用文本挖掘技术处理论坛信息数据。
目前国内外在网络热点事件传播过程发现方面取得了一定的研究成果。有些学者从研究社会关系网络入手,分析话题在论坛上的传播过程。利用统计回归模型考察各个因素对传播的影响[1],该方法主要说明了论坛意见领袖对话题传播有着重要的贡献。随着复杂网络研究的发展和深入,有些学者发现真实世界的流言的传播也具有小世界网络和无标度网络的特性[2],这与BBS的事件传播有着相同之处。万小军等人研究了信息在各个新闻网站之间的传播转载过程[3]。首先将一个新闻事件所有的文档都获取下来,按发布时间排序,依据传播关键词和相似度依次计算每个文档的源文档,从而得到该话题在不同网站之间的整体传播过程。赵丽提出了博客网络中具有突发性的话题传播模型[4],根据每个博客节点的活跃度及外部场强计算某个博客节点关注话题的概率,从而预测可能参与话题的博客节点,该文献的研究对象虽然是博客网络,但是研究成果对论坛话题传播有一定的借鉴意义。
分析已有论坛热点事件传播过程发现技术可以看出,实现热点事件传播过程发现的技术路线主要有两条:
1.从行为上分析热点事件的传播过程:论坛中的帖子与它的各个回复之间包含着用户之间的交互关系,因此可以从分析人际关系矩阵来对话题的传播进行研究。
2.从内容上分析热点事件的传播过程,主要依据各大网站对一个事件的转载来分析其在论坛上的传播路径,直观地描述事件的整个传播路径和过程。
目前对论坛上话题的传播还没有更多深入的研究,与其相关的新闻、博客的热点事件传播有了一定的研究基础。
与本发明申请有关的公开文件有:
[1]宫辉,徐渝.高效BBS社群结构与信息传播的影响因素[J].西安交通大学学报(社会科学版).2007(01);
[2]周辉.流言传播的小世界网络特性研究[J].武汉科技学院学报.2005(01);
[3]Wan,X.and J.Yang.Learning information diffusion process on theweb.in Proceedings of the 16th international conference on World WideWeb.2007.Banff,Alberta,Canada:ACM;
[4]赵丽,袁睿翕,管晓宏.博客网络中具有突发性的话题传播模型[J].软件学报.2009(20)。
发明内容
本发明的目的在于提供一种能为网络智能信息处理与舆情分析提供技术支持的论坛事件传播图的构建装置及构建方法。
本发明的目的是这样实现的:
本发明的论坛事件传播图的构建装置由网络事件数据收集装置、网络事件数据预处理装置、热点事件发现装置、传播图构建装置和输出装置连接构成;网络事件数据收集装置收集与某事件相关的原始数据信息输入网络事件数据预处理装置;网络事件数据预处理装置处理网络事件数据收集装置收集到的原始事件数据,将原始事件数据转换为适合本论坛事件传播图的构建装置处理的表示形式即提取每篇帖子的发表时间、所在论坛、帖子文本内容,并将帖子文本内容进行分词、特征提取,最终将帖子文本内容以VSM的形式表现出来;热点事件发现装置对网络事件数据预处理后的数据进行聚类,将同一个事件的相关数据聚集到一起;传播图构建装置建立事件在各个论坛之间的传播途径,并计算各个论坛对事件传播的贡献值,得到传播初始论坛、传播核心论坛;输出装置输出所发现的热点事件的传播过程的详细信息,包括在各个论坛之间的传播途径,以及各个论坛对事件传播的贡献值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010133617.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卷铁芯变压器绕线机
- 下一篇:一种具有立体图案的人造革