[发明专利]一种网络话题热度预测方法有效
申请号: | 201610958001.6 | 申请日: | 2016-10-27 |
公开(公告)号: | CN106557552B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 庞琳;刘春阳;赵志云;李雄;张旭;何扬;王萌;张小明;刘谟 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;北京航空航天大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/335;G06F16/35;G06Q50/00 |
代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 王顺荣;唐爱华 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种网络话题热度预测方法。它包括话题检测、热度预测建模、预测热度值计算三个步骤。话题检测部分负责从网络数据中获取与用户给定话题关键词相关的话题数据。预测建模部分按照用户设定的时间粒度大小统计话题检测结果中每个时间段内的话题热度值,并计算高斯过程模型关于话题热度统计时间点的协方差矩阵,构建基于高斯过程的预测模型。预测热度值计算部分针对用户给定的预测时间点,利用构建的高斯过程模型计算话题在给定时间点的热度值。本发明综合利用信息检索技术、分类技术进行话题检测,利用高斯过程模型来进行话题热度预测,提高了话题预测的实用性和有效性。 | ||
搜索关键词: | 一种 网络 话题 热度 预测 方法 | ||
【主权项】:
一种网络话题热度预测方法,其特征在于:该方法具体实现步骤如下:步骤一:用户输入与话题相关的关键词组后,利用信息检索技术从网络文本数据库中把描述该话题的文本数据检索出来,结合相关反馈技术对检索出来的文本数据进行过滤,进一步去掉检索出来的文本数据中与话题不相关的数据,剩下的文本数据即为话题相关文本数据;步骤二:对步骤一得到的话题相关文本数据,按照用户给定的时间粒度大小统计话题相关文本数据中包含的每个时间段内的话题热度值;话题相关文本数据中包含的各个时间段的话题热度值组合成话题历史热度向量;而这些进行话题热度统计所在的时间段就是话题历史热度统计时间点,根据话题历史热度统计时间点之间的相互关系计算高斯过程模型的协方差矩阵,进而构建高斯过程预测模型;步骤三:对于用户给出的预测时间点,计算该时间点与话题历史热度统计时间点之间的相关度向量,结合话题历史热度向量,利用构建的高斯过程预测模型计算话题在用户给出的预测时间点的热度值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;北京航空航天大学,未经国家计算机网络与信息安全管理中心;北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610958001.6/,转载请声明来源钻瓜专利网。