[发明专利]舆情发现方法、装置、终端设备以及存储介质在审
申请号: | 201910966956.X | 申请日: | 2019-10-12 |
公开(公告)号: | CN110728146A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 程景;魏学峰;严明;周洪斌;徐宇挺;刘俊辉;彭斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/33;G06Q50/00 |
代理公司: | 44202 广州三环专利商标代理有限公司 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户评论 关键词集合 评论 集合 有效关键词 采集周期 存储介质 告警信息 终端设备 准确率 发现 申请 | ||
1.一种舆情发现方法,其特征在于,所述方法包括:
获取第一关键词集合和第二关键词集合,所述第一关键词集合中包括多个有效关键词,所述第二关键词集合中包括多个无效关键词;
获取第一采集周期内针对目标评论对象的第一用户评论集合,所述第一用户评论集合中包括至少一条用户评论;
若所述第一用户评论集合中的任一用户评论包括所述第一关键词集合中的任意有效关键词,且不包括所述第二关键词集合中的任意无效关键词,则确定所述任一用户评论为有效评论;
获取所述第一用户评论集合中的所述有效评论对应的第一评论数量,根据所述第一评论数量生成针对所述目标评论对象的舆情告警信息。
2.根据权利要求1所述方法,其特征在于,所述根据所述第一评论数量生成针对所述目标评论对象的舆情告警信息,包括:
若所述第一评论数量大于预设评论数量阈值,则生成针对所述目标评论对象的舆情告警信息。
3.根据权利要求1所述方法,其特征在于,所述根据所述第一评论数量生成针对所述目标评论对象的舆情告警信息,包括:
获取第二采集周期内针对所述目标评论对象的第二用户评论集合,获取所述第二用户评论集合中包括的所述有效评论的第二评论数量,所述第二采集周期和所述第一采集周期是相邻的两个采集周期且所述第二采集周期位于所述第一采集周期之前;
基于所述第一评论数量和所述第二评论数量确定有效评论增长幅度,若所述有效评论增长幅度大于预设增长幅度阈值,则生成针对所述目标评论对象的舆情告警信息。
4.根据权利要求1所述方法,其特征在于,所述根据所述第一评论数量生成针对所述目标评论对象的舆情告警信息,包括:
对从所述第一用户评论集合中确定出的所有所述有效评论进行聚类以得到多个舆情类别;
在所述第一用户评论集合中所包括的所述有效评论对应的第一评论数量中确定各舆情类别对应的各第三评论数量,并基于所述各第三评论数量生成所述各舆情类别对应的舆情告警信息。
5.根据权利要求1-4任一项所述方法,其特征在于,所述获取第一关键词集合和第二关键词集合,包括:
获取第一评论集合和第二评论集合,所述第一评论集合中包括至少一条预先标记得到的第一有效评论,所述第二评论集合中包括至少一条预先标记得到的第二无效评论;
对所述第一评论集合中各第一有效评论进行分词处理以得到组成各第一有效评论的多个分词,从所述组成各第一有效评论的多个分词中提取包括预设关键字的多个分词作为有效关键词,从而得到所述第一关键词集合;
对所述第二评论集合中各第二无效评论进行分词处理以得到组成各第二无效评论的多个分词,从所述组成各第二无效评论的多个分词中提取包括所述预设关键字的多个分词作为无效关键词,从而得到所述第二关键词集合。
6.根据权利要求5所述方法,其特征在于,所述从所述组成各第一有效评论的多个分词中提取包括预设关键字的多个分词作为有效关键词,包括:
从所述组成各第一有效评论的多个分词中提取包括预设关键字的多个分词,并获取包括所述预设关键字的多个分词中各分词在所述第一评论集合中的第一出现频率;
将所述第一出现频率中大于第一预设频率阈值的分词确定为有效关键词。
7.根据权利要求1-4任一项所述方法,其特征在于,所述获取第一关键词集合和第二关键词集合,包括:
获取第一评论集合和第二评论集合,所述第一评论集合中包括至少一条预先标记得到的第一有效评论,所述第二评论集合中包括至少一条预先标记得到的第二无效评论;
对所述第一评论集合中各第一有效评论进行分词处理以得到组成各第一有效评论的多个有效分词,并获取各有效分词在所述第一评论集合中的第二出现频率,将所述第二出现频率大于第二预设频率阈值的有效分词确定为有效关键词,从而得到所述第一关键词集合;
对所述第二评论集合中各第二无效评论进行分词处理以得到组成各第二无效评论的多个无效分词,并获取各无效分词在所述第二评论集合中的第三出现频率,将所述第三出现频率大于第三预设频率阈值的无效分词确定为无效关键词,从而得到所述第二关键词集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910966956.X/1.html,转载请声明来源钻瓜专利网。