[发明专利]网络论坛中热点发现及其演化态势分析方法无效

专利信息
申请号: 201110231560.4 申请日: 2011-08-15
公开(公告)号: CN102270240A 公开(公告)日: 2011-12-07
发明(设计)人: 张伟哲;张宏莉;张玥;卢俊珈 申请(专利权)人: 哈尔滨工业大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网络 论坛 热点 发现 及其 演化 态势 分析 方法
【说明书】:

技术领域

发明涉及一种网络论坛中热点发现及其演化态势分析方法,属于网络的演化分析方法技术领域。

背景技术

现有对网络论坛中热点话题发现这个问题的解决方法主要是简单地以浏览量和回复量的多少作为评价标准,亦即浏览量和回复数多,帖子主题便是比较热门。如此简单的判断往往会忽略这些数值之中的内在的数学意义;在态势分析上使用人工跟踪的方法,往往网络论坛的管理人员对帖子的内容进行监测,以得到其演化规律,这样既费时又费力。

发明内容

本发明的目的是能够发现当前网络论坛中比较热门,持续时间比较长的帖子,得到的结果尽可能与话题实际背景与情况相符合;能够对话题在未来的一段时间内的发展态势做出分析,进而提供一种网络论坛中热点发现及其演化态势分析方法。

本发明的目的是通过以下技术方案实现的:

网络论坛中热点发现及其演化态势分析方法:

一、帖子打分方法

1、利用爬虫程序提取一个版块内所有帖子的HTML文本;2、从每个帖子文本中抽取浏览量和回复量构成二元组,设第i个帖子的二元组为(xi,yi);3、利用公式S(pi)=ω1xiaverage(x)+ω2yiaverage(y)+ω3yiximax(a)]]>计算第i个帖子的得分;其中,S(pi)代表第i个帖子的得分;average(x)表示所有帖子访问数的平均值;average(y)表示所有帖子回复数的平均值;max(α)表示所有元组中回复数比访问数的最大值;ω1[0.0-0.3],ω2[0.0-0.3],ω3[0.5-1.0]为权重因子,初始置为ω1=0.1,ω2=0.2,ω3=0.8;4、按照帖子分数高低排序,提取前k个感兴趣的热度帖子,作为演化态势分析的目标帖;

二、演化态势分析方法(基于MATLAB)

1、取得一个热度帖,根据回复记录统计自主题发布以来到抓取时每天发生的回复数(除作者自身),得到二元组(i,yi);其中,i为相距帖子发布日期的天数;yi为发生在第天的回复数;2、为这些二元组建立平面直角坐标系:以增大的方向为x轴正向,y增大的方向为y轴正向,将元组投影到该坐标系中;3、用合适的曲线y=f(x)拟合穿过这些点的曲线;4、求y=f(x)的最大极值点;如果不存在极值点,取适当大小的x0,求y的导数在x0处y′(x0)的值,若为正数则该帖热度处于上升状态,否则处于平缓或下降状态,结束;取大于xm的x0,求y的导数在x0处y′(x0)的值,若为正数则该帖热度处于上升状态,否则处于平缓或下降状态。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110231560.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top