[发明专利]一种微博传播趋势预测方法及装置在审
申请号: | 201510284821.7 | 申请日: | 2015-05-28 |
公开(公告)号: | CN104915397A | 公开(公告)日: | 2015-09-16 |
发明(设计)人: | 刘玮;王丽宏;张同虎 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 梁军 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 传播 趋势 预测 方法 装置 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种微博传播趋势预测方法及装置。
背景技术
目前,随着传统社会经济活动向社会化、网络化方向发展,以社会化媒体为载体、以突发、热点事件为焦点的社会舆情成为关注重点。在涉及国家安全、社会稳定、社会民生的突发、敏感事件的发酵和传播过程中,微博都起到了重要的推动甚至导向性作用。流行度预测是维护网络舆情安全的重要手段,对微博消息流行度以及微博传播模式做出快速、准确的预测,能够及早发现可能引发大规模爆发的微博,提早防范有害信息扩散和传播。
社交网络是一个多维度的复杂系统,节点间相互影响与相互作用频繁。在社交网络中,信息传播和用户群体行为一般都具有逐渐积累、混合发酵到瞬间爆发的特点,而这样的过程并不是线性的,不是单个因素作用简单迭加而成的,往往是多方面因素上一系列细微变化,综合作用使得整个系统达到某个临界状态时,出现涌现现象,微博的爆发是社交网络信息涌现现象在内容层面的一种表现形式。
在此系统特征背景下的微博传播趋势预测方法通常围绕微博转发特征挖掘和消息传播趋势建模两方面开展。在社交网络中基于泊松过程模型的事件流行度预测方法(申请号:201410334425.6)提出了一种对微博传播链上关键用户的转发行为进行泊松过程建模的方法进行事件流行度预测。然而,该方法需要对通过转发关系恢复完整的微博转发链,在实际应用中,爬取完整转发链面临好时较长和社交网络屏蔽、限制等多种困难,另外,该方法还需要对每个用户进行关键用户和非关键用户的识别,时间复杂度高,且建模过程的准确性过于依赖关键用户判别方法的准确性,使得其准确性较低。微博转发量预测模型生成方法及微博转发量预测方法(申请号:201410157342.4)提出的方法首先对微博转发量进行分级,然后提取每条微博的基本特征,建立基本特征与转发量类别之间的多分类模型,进而根据每一个转发量类别,建立基本特征与微博转发量之间的回归模型,最后利用训练好的多分类模型和回归模型进行待预测微博的转发量,可是该方法没有考虑传播过程的动态趋势,很多初始条件和内容相似的微博由于传播过程参与者等因素的不同而导致最终转发量存在巨大差异,仅依靠微博基本特征对微博最终转发量进行预测准确性较低。
发明内容
本发明提供一种微博传播趋势预测方法及装置,用于解决现有技术中对微博传播趋势预测的方法准确性较低的问题。
根据本发明的一个方面,提供了一种微博传播趋势预测方法,包括:获取待预测微博的基本属性特征以及传播过程特征;计算待预测微博与训练数据的基本属性特征、传播过程特征的相似度,根据计算得到的相似度按照传播过程类别对待预测微博进行分类,得到待预测微博所属的传播过程类别,传播过程类别由训练数据的传播过程特征相似度聚类得到;根据待预测微博的传播过程类别选择对应的回归模型,回归模型为预先根据训练数据建立的回归模型;根据选择的回归模型对待预测微博的传播趋势进行预测。
其中,上述传播过程特征包括:微博数据的传播过程中的内容特征、微博数据的传播过程中的转发数据特征以及微博数据传播过程中的用户特征。
进一步的,上述方法还包括:
在获取待预测微博的基本属性特征以及传播过程特征之前,根据训练数据的传播过程类别分别建立训练数据的传播中的内容特征、转发数据特征以及用户特征与训练数据的基本特征以及传播过程特征的线性回归模型。
其中,根据选择的回归模型对待预测微博的传播趋势进行预测,包括:
依次根据选择的回归模型对待预测微博的内容关键词的个数、待预测微博的转发量以及待预测微博的传播范围进行预测。
其中,上述基本属性特征,包括:发帖用户的属性以及微博内容的属性。
根据本发明的另一个方面,提供了一种微博传播趋势预测装置,包括:获取模块,用于获取待预测微博的基本属性特征以及传播过程特征;分类模块,用于计算待预测微博与训练数据的基本属性特征、传播过程特征的相似度,根据计算得到的相似度按照训传播过程类别对待预测微博进行分类,得到待预测微博所属的传播过程类别,传播过程类别由训练数据的传播过程特征相似度聚类得到;选择模块,用于根据待预测微博的传播过程类别选择对应的回归模型,训练回归为预先根据训练数据建立的回归模型;预测模块,用于根据选择的回归模型对待预测微博的传播趋势进行预测。
其中,上述传播过程特征包括:微博数据的传播过程中的内容特征、微博数据的传播过程中的转发数据特征以及微博数据传播过程中的用户特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510284821.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:GIS信息更新方法和系统
- 下一篇:一种基于信任关系的物品推荐方法