[发明专利]微博热点话题自动检测方法及装置在审
申请号: | 201310536067.2 | 申请日: | 2013-11-01 |
公开(公告)号: | CN104615593A | 公开(公告)日: | 2015-05-13 |
发明(设计)人: | 赵立永;于晓明;杨建武 | 申请(专利权)人: | 北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李相雨 |
地址: | 100871 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种微博热点话题自动检测方法及装置,涉及互联网技术领域,本发明通过对待检测的微博文本依次进行关键词提取、关键词组获取及关键词组聚类,以获得候选关键词簇,最后计算各个候选关键词簇所对应话题的热度值并根据热度值选择热点话题,减小了热点话题检测的复杂度,并实现有效的热点话题检测。 | ||
搜索关键词: | 热点话题 自动检测 方法 装置 | ||
【主权项】:
一种微博热点话题自动检测方法,其特征在于,所述方法包括以下步骤:S1:抓取待检测的微博文本;S2:对所述微博文本进行关键词提取;S3:根据各个关键词之间的相关性,获取关键词组;S4:根据各个关键词组之间的相关性,对所述关键词组进行聚类,以获得候选关键词簇;S5:计算每个候选关键词簇所代表话题的热度值,根据所述热度值对所述候选关键词簇进行排序,按照所述热度值从大到小顺序在所述候选关键词簇中选择N个关键词簇,并将所述N个关键词簇分别代表的话题作为热点话题,所述N为不小于1的整数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京大学;北京北大方正电子有限公司,未经北大方正集团有限公司;北京大学;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310536067.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据更新方法及装置
- 下一篇:基于上下文的前向输入纠错方法和装置