[发明专利]一种基于关键用户的微博信息传播预测方法有效
申请号: | 201610629837.1 | 申请日: | 2016-08-03 |
公开(公告)号: | CN106257459B | 公开(公告)日: | 2019-11-01 |
发明(设计)人: | 杨武;于淼;王巍;苘大鹏;玄世昌 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F16/95 | 分类号: | G06F16/95 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的是一种基于关键用户的微博信息传播预测方法。步骤1:数据采集;步骤2:数据处理;步骤3:利用线性模型预测;步骤4:基于关键用户挖掘的模型调整,进行后续预测。本发明的方法,利用从微博网络上获取的消息的用户转发数据,通过基于关键用户的动态线性模型来预测未来信息传播的状态,并在预测的过程中实时的挖掘关键用户,在新增关键用户的基础上对线性模型进行改进。 | ||
搜索关键词: | 一种 基于 关键 用户 信息 传播 预测 方法 | ||
【主权项】:
1.一种基于关键用户的微博信息传播预测方法,包括如下步骤,步骤1:数据采集;步骤2:数据处理;步骤3:利用线性模型预测;步骤4:基于关键用户挖掘的模型调整,进行后续预测;其特征是:在步骤3中,线性模型预测是指根据给定的训练时间窗口训练线性模型对下一个时间窗口进行预测,在线性预测模型预测的过程中仅考虑关键用户对转发规模具有影响,并建立公式(1),公式(1)由三部分组成,考虑微博消息制造者作为第一个关键用户与其他的关键用户的影响效果的不同,使用参数at,bt对两类关键用户进行区分,然后是用dt来调节其他节点带来的部分消息转发影响,其中表示t时刻用户ui的预测转发量,表示m消息在t时刻的关键用户集合,首先确定发布用户为第一个关键用户,然后根据训练集中用户的被转发数确定训练集关键用户,最后通过公式(1)进行预测;在步骤4中,初始候选集合选取,是指根据预测值和实际值的差异性来确定是否进行关键用户挖掘并根据关键用户改进线性模型,在消息的传播过程中,将关键用户作为微博转发规模预测准确度的重要因素,当关键用户出现在预测时间窗口内时,会产生相应的预测偏差,定义Key_Thrseshold作为关键用户存在阈值,其公式如所示:当Key_Thrseshold<θ时,证明该时间窗口内不存在影响预测的关键用户,当Key_Thrseshold≥θ时并且R_Fact(t)‑R_Precdit(t)≥10表明该预测时间窗内可能存在影响预测的关键用户,需要对该时间窗口进行关键用户挖掘,Key_Thrseshold≥θ表明预测算法和实际值有较大的差异,同时当Key_Thrseshold≤‑θ时,表明之前窗口可能有部分的关键用户失效,需要删除关键用户影响,首先根据该时间窗口中的用户自身转发数进行用户排序,生成排序集合依次的将集合中的用户添加到下列公式中,直到满足下列公式为止,通过找到的关键用户集合对线性模型进行动态的调整,来进行下一步的预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610629837.1/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置