[发明专利]一种基于主题的微博转发预测方法与系统在审
申请号: | 201611185198.0 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106600071A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 郭培伦;陈雁;杨晶宇;李平;胡栋;葛忆 | 申请(专利权)人: | 西南石油大学;四川数智汇通数据有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 610500 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于主题的微博转发预测方法与系统,所述的方法包括以下步骤爬取相应的微博,并根据时间窗D的大小分别存储相应的微博转发关系及微博内容;对爬取的微博进行主题分类,重新按微博主题对爬取的微博转发关系进行存储,针对每个微博主题建立微博转发关系网络;根据每个微博主题转发库中的转发关系,计算每条边的权重;对待测微博进行微博转发预测;所述的系统包括数据爬取模块、微博库、转发关系库、分析模块、预测关系库、用户前端模块和用户后端模块;本发明针对不同的微博主题转发关系进行预测,基于对不同微博主题转发关系的转发预测,提高了预测准确度。 | ||
搜索关键词: | 一种 基于 主题 转发 预测 方法 系统 | ||
【主权项】:
一种基于主题的微博转发预测方法,其特征在于,它包括以下步骤:S1:爬取相应的微博,并根据时间窗D的大小分别存储相应的微博转发关系及微博内容;S2:基于现有的主题模型对爬取的微博内容进行主题分类;S3:根据不同的主题分类分别存储相应的微博转发关系;S4:根据不同主题的转发关系,建立有向图网络;S5:统计每个微博用户发布的微博被转发的总数N,以及对应的各个关注者转发的数量n1,n2,n3…ni,计算对应的每条有向边的初始权重为S6:统计有向网络中节点个数M,并给予每个节点1/M的权重;S7:更新每个节点的权重,以首先发布微博的用户为节点,把当前节点的权重根据有向边的权重分配到直接该微博的节点上;S8:完成发布微博的用户和第一批关注者的节点权重更新以后,依次更新剩下的各批关注者的节点的权重;S9:重复S8步骤,直到每个节点的权重收敛;S10:获取待测微博的第一批关注者的权重w1,w2,…wn;S11:根据需要设定一个权重阈值Q1,循环判断所述第一批关注者的权重w1,w2,…wn是否超过阈值Q1,如果超过,则保留;如果没有超过,则去除;如果都不超过,则去掉topK个权重值后作为下一个阶段的传播预测;S12:重复S11,根据需要设定一个关注者个数阈值Q2,直到关注者的权重都小于Q1且注者的个数都小于Q2时,停止预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学;四川数智汇通数据有限公司,未经西南石油大学;四川数智汇通数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611185198.0/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理