[发明专利]一种热点事件的预测方法及装置有效
申请号: | 201811268032.4 | 申请日: | 2018-10-29 |
公开(公告)号: | CN111104627B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 薛戬 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 热点 事件 预测 方法 装置 | ||
本发明公开了一种热点事件的预测方法及装置,本发明中获取多个已发布信息在预设时间周期内的信息数据,对于每一已发布信息,根据所述信息数据,计算每个已发布信息在所述预设时间周期内的信息增长度,依据每个已发布信息对应的信息增长度,对多个已发布信息进行排序并输出排序结果。通过本发明可以得到已发布信息的排序结果,排序结果中序列号较小的就有可能成为热点事件,通过本发明实施例可以筛选得到热点事件,减少了人工手工筛选过程中的人力投入。
技术领域
本发明涉及数据处理领域,更具体的说,涉及一种热点事件的预测方法及装置。
背景技术
数字互联网上的信息冗余、碎片化严重,同一时间会出现海量信息,媒体工作人员需要从海量信息中提取出有用信息。
现有技术中,是工作人员人工在网上发布的信息中检索得到热点事件,但是人工检索热点事件的方式,浪费人力。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种热点事件的预测方法及装置。
一种热点事件的预测方法,包括:
获取多个已发布信息在预设时间周期内的信息数据;
对于每一已发布信息,根据所述信息数据,计算每个已发布信息在所述预设时间周期内的信息增长度;其中,所述信息增长度表征已发布信息的热门程度;
依据每个已发布信息对应的信息增长度,对多个已发布信息进行排序并输出排序结果。
优选地,对于每一已发布信息,根据所述信息数据,计算每个已发布信息在所述预设时间周期内的信息增长度,包括:
对于每一已发布信息,根据所述信息数据,计算在所述预设时间周期内所述已发布信息在不同预设指标下的数据增长度;
获取每一所述预设指标对应的权重值;
根据所述已发布信息在不同预设指标下的数据增长度和每一所述预设指标对应的权重值,计算得到所述信息增长度。
优选地,将不同预设指标下的数据增长度与相应预设指标的权重值的乘积之和作为所述信息增长度。
优选地,对于每一已发布信息,根据所述信息数据,计算在所述预设时间周期内所述已发布信息在不同预设指标下的数据增长度,包括:
对于每一已发布信息,根据所述信息数据,获取所述已发布信息在预设指标下的数据增长量;
根据所述数据增长量,计算所述已发布信息在预设指标下的增量斜率;
获取发表所述已发布信息的账号在所述预设指标下的历史数据增量均值;历史数据增量均值为与所述预设时间周期对应的历史时间周期内的增量均值;
根据所述增量斜率、所述数据增长量和所述历史数据增量均值,计算得到所述数据增长度。
优选地,获取发表所述已发布信息的账号在所述预设指标下的历史数据增量均值之前,还包括:
获取在预设历史时间周期内,所述账号发表的每一文章在每一预设固定周期的增长量;
根据所述每一文章在每一预设固定周期的增长量,确定所述账号在不同的固定时间周期内的指标平均增长量;
从所述账号在每一固定时间周期内的指标平均增长量获取到在所述历史时间周期内的指标平均增长量;
将获取的指标平均增长量作为所述历史数据增量均值。
优选地,若未获取到发表所述已发布信息的账号在所述预设指标下的历史数据增量均值,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811268032.4/2.html,转载请声明来源钻瓜专利网。