[发明专利]一种社交网络信息传播范围预测方法及系统有效

申请号：	202010682101.7	申请日：	2020-07-15
公开（公告）号：	CN111967645B	公开（公告）日：	2022-04-29
发明（设计）人：	赵虹;李浩;李悦江	申请（专利权）人：	清华大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06F30/27;G06Q50/00;G06F111/08
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	李文清
地址：	100084 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种社交网络信息传播范围预测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供一种社交网络信息传播范围预测方法及系统，该方法包括：社交网络中用户与周围邻居的交互作为目标问题，构建决策网络模型；基于多智能体强化学习训练好的决策网络模型，预测社交网络中的信息传播范围。本发明实施例提供的社交网络信息传播范围预测方法及系统，通过多智能体强化学习引入了未来的回报对用户的影响，更加贴近实际，同时使用深度神经网络表示用户的策略，通过调整神经网络的参数提高了泛化性。

技术领域

本发明涉及社交网络信息处理技术领域，尤其涉及一种社交网络信息传播范围预测方法及系统。

背景技术

随着通信技术的发展和手机、电脑等终端的普及，社交网络的规模日益庞大。社交网络已经成为了信息传播的重要渠道，社交网络中的信息传播机制也逐渐成为研究热点。商业广告和政策宣传都需要尽可能扩大传播范围，而有害信息则需要尽可能缩小其传播范围。因此研究信息在社交网络中的传播机制、预测信息传播范围具有非常重要的现实意义。已经有研究从统计角度证明，社交网络中的用户会受到其它用户(特别是好友)的影响，从而决定是否选择转发一条消息。这表明信息传播过程中用户之间存在交互，每个用户会根据其他用户对信息的态度选择是否转发信息。

现有技术中，一些学者尝试用图演化博弈理论对社交网络上用户之间的交互进行建模，以此刻画信息在社交网络中的传播过程并预测信息传播范围。基于图演化博弈论的信息传播模型由以下基本要素组成：社交网络的拓扑结构、用户动作、适应度、更新规则和演化平衡状态。

但是，基于图演化博弈论的信息传播模型忽略了未来的回报。在实际社交网络中，用户选择是否转发某一个信息时会考虑未来的情况。基于图演化博弈论的信息传播模型根据更新规则使用适应度来选择动作，而适应度仅与当前的回报有关，与未来的回报无关。因此基于图演化博弈论的信息传播模型中用户只考虑现在而忽略了未来。并且基于图演化博弈论的信息传播模型的泛化能力较差。基于图演化博弈论的信息传播模型使用更新规则描述用户与邻居的交互。更新规则本质上是用户对邻居的动作以适应度为权重进行模仿和复制，同时为了便于分析，更新规则往往具有简明的数学表达式。这为图演化博弈理论带来了坚实的数学基础，同时也限制了图演化博弈理论的泛化性和表示复杂用户交互的能力。因此，现在亟需一种社交网络信息传播范围预测方法及系统来解决上述问题。

发明内容

针对现有技术存在的问题，本发明实施例提供一种社交网络信息传播范围预测方法及系统。

第一方面，本发明实施例提供了一种社交网络信息传播范围预测方法，包括：

社交网络中用户与周围邻居的交互作为目标问题，构建决策网络模型；

基于多智能体强化学习训练好的决策网络模型，预测社交网络中的信息传播范围。

进一步地，所述社交网络中用户与周围邻居的交互作为目标问题，构建决策网络模型，包括：

基于社交网络中用户与周围邻居的交互作为目标问题，构建双层的全连接神经网络，其中，输入是邻居中选择动作f的比例，输出是选择动作f的概率和选择动作n的概率。

进一步地，所述方法还包括：

对所述决策网络模型进行训练，得到训练好的决策网络模型。

进一步地，所述对所述决策网络模型进行训练，得到训练好的决策网络模型，包括：

对社交网络初始化，并获取观测值、动作对序列和回报序列；

基于策略梯度法更新中心节点的决策网络参数，并对非中心节点的决策网络参数进行软更新，在循环执行预设次数之后，得到训练好的网络模型参数。