[发明专利]基于相似关系和共现关系的话题流行度预测方法有效

专利信息
申请号: 201710402801.4 申请日: 2017-06-01
公开(公告)号: CN107203632B 公开(公告)日: 2019-08-16
发明(设计)人: 邓璐;贾焰;周斌;李爱平;韩伟红;黄九鸣;江荣;全拥;刘强;张良;张涛;刘心;童咏之;胡玥 申请(专利权)人: 中国人民解放军国防科学技术大学
主分类号: G06F16/9536 分类号: G06F16/9536;G06F16/35;G06Q50/00
代理公司: 北京中济纬天专利代理有限公司 11429 代理人: 陆薇薇
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 流行度 话题 相似关系 社交网络 大数据 向量 预测 集合 短期预测 建模分析 输入文档 选择概率 文档 词汇 概率 应用
【说明书】:

发明属于社交网络大数据技术领域,具体涉及一种基于相似关系和共现关系的话题流行度预测方法,包括主要步骤:(S1)输入文档集合,通过LDA建模分析得到话题集合、每个话题的词汇分布和每个文档的话题分布;(S2)计算话题的相似向量;(S3)计算话题的共现向量;(S4)定义流行度,并计算话题流行度;(S5)计算话题基于相似关系的流行度;(S6)计算话题基于共现关系的流行度;(S7)根据步骤(S5)和步骤(S6)的计算结果,分别计算话题在四类流行度情况下的概率值,选择概率值最大的类别作为该话题的最终流行度。本发明方法将话题流行度预测应用到了社交网络大数据中,实现了话题流行程度的短期预测。

技术领域

本发明属于社交网络大数据技术领域,具体涉及一种基于相似关系和共现关系的话题流行度预测方法。

背景技术

微博作为当今最为流行的在线社会网络形式之一,近几年得到了迅速发展,它是一种互动及传播性极快的平台,传播速度甚至比一般社会网络和媒体都要快。微博的出现,很多新闻事件和热点话题在微博网站得以快速、广泛地传播,成为网民获取信息、分享信息、交友的重要平台。用户发表话题根据其作者、内容的不同,将会受到不同程度的关注,为了更好地将有价值、流行度较高的话题推荐给用户,对话题流行度进行合理排序,有必要对用户发表的话题流行度进行合理预测。然而,话题流行度预测是一个具有挑战性的研究课题,涉及的方面很多,目前尚未有成熟的方案。参考文献[1]首先发现了在线内容在早期和晚期热度的对数值之间的强线性关系,基于此发现,他们提出了Szabo-Huberman模型来预测在线内容的热度。该方法虽然发现了流行度之间的数值关系,但仅针对具体数值,而在实际应用中,更关心的是内容的流行程度而不是具体数值。

参考文献[2]提出了适合长期预测的算法,基本思想是对待预测的话题,假设其历史热度曲线,根据与它历史热度曲线最相似的其他话题的热度曲线来预测话题未来的变化趋势,该方法的不足之处是无法应对短期预测的问题。

参考文献[3]提出了一种基于k近邻的预测帖子流行度方法,它以帖子的点击数作为流行度的衡量标准,根据与话题相似的k个话题的流行度情况预测话题的发展趋势。该方法采用的是向量空间模型表示,在找出最相似的k个话题上存在较大的误差。

参考文献[4]提出一种基于k近邻和LDA模型(Latent Dirichlet Allocation)的预测方法,该方法除了考虑了近邻方法还加入了对作者兴趣特征的考虑。该方法虽然采用LDA模型,弥补了向量空间模型的问题,但是没有加入话题之间的共现关系的考虑,共现话题存在一定的逻辑关联,对于话题流行度预测具有重要的作用。具体参考文献如下:

[1]Szabo G,Huberman B A.Predicting the popularity of onlinecontent.2010

[2]Gao H,Wang SS,Fu Y.Prediction model for long-term developmenttrend of web sentiment.2011

[3]Nie RL,Chen L,Wang YQ,et,al,algorithm for prediction of new topic’shotnessusing the k-nearest neighbors.2012.

[4]Wang WJ,Chen L,Wang YQ,et,al,Algorithm for prediction of post’shotness using k—nearest neighbors and latent dirichlet allocation.2014.

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710402801.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top