[发明专利]互联网舆情的专题分析方法和装置有效

专利信息
申请号: 201110455219.7 申请日: 2011-12-28
公开(公告)号: CN103186600A 公开(公告)日: 2013-07-03
发明(设计)人: 孙红娥;张丹;王松;梁汝峰;杨建武;吴新丽 申请(专利权)人: 北大方正集团有限公司;北京大学;北京北大方正电子有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 王达佐
地址: 100871 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 互联网 舆情 专题 分析 方法 装置
【权利要求书】:

1.一种互联网舆情的专题分析方法,其特征在于,包括:

采集互联网舆情文件;

采用预设的专题规则匹配所述互联网舆情文件;

对匹配成功的所述互联网舆情文件生成专题。

2.根据权利要求2所述的方法,其特征在于,从以下至少一种互联网信息源中采集所述互联网舆情文件:新闻网站、论坛、博客、微博、即时通信、SNS。

3.根据权利要求1所述的方法,其特征在于,采用预设的专题规则匹配所述互联网舆情文件包括:

读取所述互联网舆情文件的内容;

确定将所述内容的拼音;

以所述专题规则中的拼音形式的关键词检索式检索所述内容的拼音。

4.根据权利要求1所述的方法,其特征在于,对匹配成功的所述互联网舆情文件生成专题包括:

读取所述匹配成功的互联网舆情文件的内容、时间、标题、网站类型、网站资质、访问量、回帖量和所属网站信息;

采用质心比较方法或最近邻比较方法,确定与所述匹配成功的互联网舆情文件最相近的专题;

若不存在与所述匹配成功的互联网舆情相近的专题,则将其列为新专题;若存在与所述匹配成功的互联网舆情相近的专题,则将其加入所述最相近的专题。

5.根据权利要求4所述的方法,其特征在于,所述质心比较方法包括:

将所述读取到的内容与已有专题进行比较,同时考虑时间特征和内容特征,计算所选舆情文件和专题间的相似度,所述已有专题本身通过其中综合权重最高的文章来表达。

6.根据权利要求4所述的方法,其特征在于,所述最近邻比较方法包括:

当以一个所述专题规则处理设置数量的所述舆情文章之后,对该专题规则内专题两两比较;如果两个专题的相似度大于合并阈值,则将其合并;对各专题内的舆情文章进行淘汰:重新计算舆情文章和该主题的相似度,对相似度低于聚类阈值、或者不满足特定限制条件的舆情文章进行淘汰。

7.根据权利要求1所述的方法,其特征在于,还包括按照以下至少一种展示方式展示所述专题:

按照树的方式展示所述专题,其中,所述专题在所述树中的从属关系与其相应的所述专题规则之间的从属关系保持一致;

展示所述专题的列表;

以三维图的方式展示各热点事件之间的关联关系,以圆球代表单个热点事件,以圆球的空间大小表示其热度,相关联事件以相同颜色的圆球表示,颜色相同,并且距离很近的小球,代表相近似的主题;

以二维图形的方式展示出一段时间内受到关注的几个不同事件在网上的演化过程,包括其产生、发展、合并和分裂情况;

对单一专题生成报告,包括专点标题、摘要、相关文档及详细信息、时间分布图、网站分布图、信息类型分布图、褒贬义;

以FLASH动画的方式展示出单一专题在网站间的传播路径关系,以椭圆形代表信息传出的网站名称,以箭头和箭头旁边的数字表示信息的传播途径和传播顺序;

对所述专题提供网站分析、地域分析、时间分布、信息类型分布和褒贬义分布分析。

8.一种互联网舆情的专题分析装置,其特征在于,包括:

采集模块,用于采集互联网舆情文件;

匹配模块,用于采用预设的专题规则匹配所述互联网舆情文件;

生成模块,用于对匹配成功的所述互联网舆情文件生成专题。

9.根据权利要求8所述的装置,其特征在于,从以下至少一种互联网信息源中采集所述互联网舆情文件:新闻网站、论坛、博客、微博、即时通信、SNS。

10.根据权利要求8所述的装置,其特征在于,所述匹配模块包括:

读取模块,用于读取所述互联网舆情文件的内容;

拼音模块,用于确定将所述内容的拼音;

检索模块,用于以所述专题规则中的拼音形式的关键词检索式检索所述内容的拼音。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京大学;北京北大方正电子有限公司,未经北大方正集团有限公司;北京大学;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110455219.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top