[发明专利]基于相似关系和共现关系的话题流行度预测方法有效
申请号: | 201710402801.4 | 申请日: | 2017-06-01 |
公开(公告)号: | CN107203632B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 邓璐;贾焰;周斌;李爱平;韩伟红;黄九鸣;江荣;全拥;刘强;张良;张涛;刘心;童咏之;胡玥 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/35;G06Q50/00 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陆薇薇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于社交网络大数据技术领域,具体涉及一种基于相似关系和共现关系的话题流行度预测方法,包括主要步骤:(S1)输入文档集合,通过LDA建模分析得到话题集合、每个话题的词汇分布和每个文档的话题分布;(S2)计算话题的相似向量;(S3)计算话题的共现向量;(S4)定义流行度,并计算话题流行度;(S5)计算话题基于相似关系的流行度;(S6)计算话题基于共现关系的流行度;(S7)根据步骤(S5)和步骤(S6)的计算结果,分别计算话题在四类流行度情况下的概率值,选择概率值最大的类别作为该话题的最终流行度。本发明方法将话题流行度预测应用到了社交网络大数据中,实现了话题流行程度的短期预测。 | ||
搜索关键词: | 流行度 话题 相似关系 社交网络 大数据 向量 预测 集合 短期预测 建模分析 输入文档 选择概率 文档 词汇 概率 应用 | ||
【主权项】:
1.一种基于相似关系和共现关系的话题流行度预测方法,其特征在于,包括以下步骤:(S1)输入文档集合,通过LDA建模分析得到话题集合、每个话题的词汇分布和每个文档的话题分布;(S2)针对任一个话题za,根据话题za的词汇分布,通过KL散度法计算话题za与其他话题的相似关系,即话题za的相似向量;(S3)针对任一个文档d,根据文档d的话题分布,将文档d中的话题按照分布概率值进行降序排列,取出概率最大的3个话题作为文档d的代表性话题,并计算话题za与其他话题的共现关系,即话题za的共现向量;所述计算话题za与其他话题的共现关系具体为:Cooccurrence(za)={(z1,wc‑a1),(z2,wc‑a2),...,(zm,wc‑am))其中,Cooccurrence(za)表示话题za的共现向量,zi表示第i个话题,wc‑ai为第i个话题对应的共现权重,i=1,2,…,m且i≠a,m表示话题总数;Cor(za,zb)=∑d∈Fφ(za,zb,d),F为文档集合,za和zb表示任意两个话题,d表示文档,S(d)表示文档的代表性话题集合;(S4)定义流行度,并计算话题的流行度;假设给定一个微博c,记微博c的发表时间为0时刻,则在t时刻的转发次数记为R(c,t),即微博c在时刻t的流行度;设话题za包含若干条微博,记话题za中第一条微博的发表时间为0时刻,则在t时刻的属于该话题za的所有微博转发次数之和记为R(za,t),即话题za在时刻t的流行度;定义R(za,t1)表示话题za在t1时刻的流行度,R(za,t2)表示话题za在预测时刻t2的流行度,t2>t1,则计算评价中间量q:q=R(za,t1)/R(za,t2);设定三个阈值p1、p2、p3,且p1<p2<p3,将话题流行度分为四个类别,根据评价中间量q得到话题流行度类别,具体为,如果q<p1,则为L1类;如果p1≤q<p2,则为L2类;如果p2≤q<p3,则为L3类;如果q≥p3,则为L4类;(S5)计算话题za基于相似关系的流行度,具体过程为:从话题za的相似向量中选出k个相似权重最高的话题,记为Ssim(za),通过这k个话题的流行度类别和与话题za的相似关系,计算话题za在相似关系下属于四种流行度类别的情况,计算公式如下:其中β的取值为1,2,3,4,zj表示话题,ws‑aj为话题zj对应的相似权重,R(zj)表示话题zj所属流行度类别,δ()表示布尔函数,(S6)计算话题za基于共现关系的流行度,具体过程为:从话题za的共现向量中选出k个共现权重最高的话题,记为Scor(za),通过这k个话题的流行度类别以及与话题za的共现情况,计算话题za在共现关系下属于四种流行度类别的情况,计算公式如下:其中zl表示话题,wc‑al为话题zl对应的相似权重,R(zl)表示话题z,所属流行度类别;(S7)根据步骤(S5)和步骤(S6)的计算结果,分别计算话题za在L1、L2、L3、L4四类情况下的概率值,选择概率值最大的类别作为该话题za的最终流行度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710402801.4/,转载请声明来源钻瓜专利网。
- 上一篇:具有金属线固定件的窗框衣架
- 下一篇:用于牵引装置的可脱离的致动器臂