[发明专利]一种网络舆情事件的热度分析方法及系统在审
申请号: | 201310525071.9 | 申请日: | 2013-10-30 |
公开(公告)号: | CN104598450A | 公开(公告)日: | 2015-05-06 |
发明(设计)人: | 赵增峰;梁汝峰;杨建武 | 申请(专利权)人: | 北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;任晓航 |
地址: | 100871 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 舆情 事件 热度 分析 方法 系统 | ||
1.一种网络舆情事件的热度分析方法,包括以下步骤:
(1)对所要采集的网站进行数据的采集与保存;
(2)对采集的数据进行聚类分析,将采集的数据分类成不同的话题事件;
(3)根据事件热点指数计算模型计算每个话题事件的热点指数。
2.如权利要求1所述的一种舆情事件的热度分析方法,其特征在于,步骤(1)中,进行数据采集时,所采集的数据的基本属性包括事件的标题、链接地址、正文、所属网站和所属频道。
3.如权利要求2所述的一种舆情事件的热度分析方法,其特征在于,步骤(1)中,如果所采集的数据为论坛数据,所采集的数据的基本属性还包括事件的点击数量、回帖数量、是否置为网站首页、是否加精、是否置顶、是否推荐、以及跟帖内容和跟帖网名。
4.如权利要求1所述的一种舆情事件的热度分析方法,其特征在于,步骤(3)中,所述的事件热点指数计算模型是根据事件的多维度参数和网站权重建立的计算事件热度的模型,所述的多维度参数包括数量维度、显著维度和分布维度。
5.如权利要求4所述的一种舆情事件的热度分析方法,其特征在于,所述的数量维度A是反映话题事件的信息数量、总点击数量和总跟帖数量的参数;
所述的显著维度B是反映话题事件的信息在论坛或者网站中是否加精、置顶、置为网站首页或者推荐的参数;
所述的分布参数C是反映话题事件在网站的分布数量及在各论坛的跟帖网友的数量的参数。
6.如权利要求4所述的一种舆情事件的热度分析方法,其特征在于,根据网站的影响力设置网站权重,影响力越大,网站权重值越大。
7.如权利要求4至6之一所述的一种舆情事件的热度分析方法,其特征在于,根据事件热点指数计算模型计算每个话题事件的热点指数的具体方式为:
事件热点指数=(数量维度值×数量维度权重+显著维度值×显著维度权重+分布维度值×分布维度权重)×平均网站权重;
其中,数量维度值=(信息数量得分+总点击数量得分+总跟帖数量得分)×数量维度权重;
显著维度值=(网站首页得分+加精得分+置顶得分+推荐得分)×显著维度权重;
分布维度值=(网站分布数量得分+网友分布数量得分)×分布维度权重;
网站平均权重为事件所包含的所有文章所在网站的网站权重的均值。
8.一种舆情事件的热度分析系统,包括:
数据采集模块,用于对所要采集的网站进行数据的采集与保存;
聚类分析模块,对采集的数据进行聚类分析,将采集的数据分类成不同的话题事件;
热点指数计算模块,根据事件热点指数计算模型计算每个话题事件的热点指数。
9.如权利要求8所述的一种舆情事件的热度分析系统,其特征在于,所述的事件热点指数计算模型是根据事件的多维度参数和网站权重建立的计算事件热度的模型,所述的多维度参数包括数量维度、显著维度和分布维度。
10.如权利要求9所述的一种舆情事件的热度分析系统,其特征在于,所述的热点指数计算模块根据事件热点指数计算模型计算每个话题事件的热点指数的具体方式为:
事件热点指数=(数量维度值×数量维度权重+显著维度值×显著维度权重+分布维度值×分布维度权重)×平均网站权重;
其中,数量维度值=(信息数量得分+总点击数量得分+总跟帖数量得分)×数量维度权重;
显著维度值=(网站首页得分+加精得分+置顶得分+推荐得分)×显著维度权重;
分布维度值=(网站分布数量得分+网友分布数量得分)×分布维度权重;
网站平均权重为事件所包含的所有文章所在网站的网站权重的均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京大学;北京北大方正电子有限公司;,未经北大方正集团有限公司;北京大学;北京北大方正电子有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310525071.9/1.html,转载请声明来源钻瓜专利网。