[发明专利]网络论坛中热点发现及其演化态势分析方法无效
申请号: | 201110231560.4 | 申请日: | 2011-08-15 |
公开(公告)号: | CN102270240A | 公开(公告)日: | 2011-12-07 |
发明(设计)人: | 张伟哲;张宏莉;张玥;卢俊珈 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 论坛 热点 发现 及其 演化 态势 分析 方法 | ||
技术领域
本发明涉及一种网络论坛中热点发现及其演化态势分析方法,属于网络的演化分析方法技术领域。
背景技术
现有对网络论坛中热点话题发现这个问题的解决方法主要是简单地以浏览量和回复量的多少作为评价标准,亦即浏览量和回复数多,帖子主题便是比较热门。如此简单的判断往往会忽略这些数值之中的内在的数学意义;在态势分析上使用人工跟踪的方法,往往网络论坛的管理人员对帖子的内容进行监测,以得到其演化规律,这样既费时又费力。
发明内容
本发明的目的是能够发现当前网络论坛中比较热门,持续时间比较长的帖子,得到的结果尽可能与话题实际背景与情况相符合;能够对话题在未来的一段时间内的发展态势做出分析,进而提供一种网络论坛中热点发现及其演化态势分析方法。
本发明的目的是通过以下技术方案实现的:
网络论坛中热点发现及其演化态势分析方法:
一、帖子打分方法
1、利用爬虫程序提取一个版块内所有帖子的HTML文本;2、从每个帖子文本中抽取浏览量和回复量构成二元组,设第i个帖子的二元组为(xi,yi);3、利用公式
二、演化态势分析方法(基于MATLAB)
1、取得一个热度帖,根据回复记录统计自主题发布以来到抓取时每天发生的回复数(除作者自身),得到二元组(i,yi);其中,i为相距帖子发布日期的天数;yi为发生在第天的回复数;2、为这些二元组建立平面直角坐标系:以增大的方向为x轴正向,y增大的方向为y轴正向,将元组投影到该坐标系中;3、用合适的曲线y=f(x)拟合穿过这些点的曲线;4、求y=f(x)的最大极值点;如果不存在极值点,取适当大小的x0,求y的导数在x0处y′(x0)的值,若为正数则该帖热度处于上升状态,否则处于平缓或下降状态,结束;取大于xm的x0,求y的导数在x0处y′(x0)的值,若为正数则该帖热度处于上升状态,否则处于平缓或下降状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110231560.4/2.html,转载请声明来源钻瓜专利网。