[发明专利]一种社交网络信息传播范围预测方法及系统有效
申请号: | 202010682101.7 | 申请日: | 2020-07-15 |
公开(公告)号: | CN111967645B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 赵虹;李浩;李悦江 | 申请(专利权)人: | 清华大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F30/27;G06Q50/00;G06F111/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李文清 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 信息 传播 范围 预测 方法 系统 | ||
本发明实施例提供一种社交网络信息传播范围预测方法及系统,该方法包括:社交网络中用户与周围邻居的交互作为目标问题,构建决策网络模型;基于多智能体强化学习训练好的决策网络模型,预测社交网络中的信息传播范围。本发明实施例提供的社交网络信息传播范围预测方法及系统,通过多智能体强化学习引入了未来的回报对用户的影响,更加贴近实际,同时使用深度神经网络表示用户的策略,通过调整神经网络的参数提高了泛化性。
技术领域
本发明涉及社交网络信息处理技术领域,尤其涉及一种社交网络信息传播范围预测方法及系统。
背景技术
随着通信技术的发展和手机、电脑等终端的普及,社交网络的规模日益庞大。社交网络已经成为了信息传播的重要渠道,社交网络中的信息传播机制也逐渐成为研究热点。商业广告和政策宣传都需要尽可能扩大传播范围,而有害信息则需要尽可能缩小其传播范围。因此研究信息在社交网络中的传播机制、预测信息传播范围具有非常重要的现实意义。已经有研究从统计角度证明,社交网络中的用户会受到其它用户(特别是好友)的影响,从而决定是否选择转发一条消息。这表明信息传播过程中用户之间存在交互,每个用户会根据其他用户对信息的态度选择是否转发信息。
现有技术中,一些学者尝试用图演化博弈理论对社交网络上用户之间的交互进行建模,以此刻画信息在社交网络中的传播过程并预测信息传播范围。基于图演化博弈论的信息传播模型由以下基本要素组成:社交网络的拓扑结构、用户动作、适应度、更新规则和演化平衡状态。
但是,基于图演化博弈论的信息传播模型忽略了未来的回报。在实际社交网络中,用户选择是否转发某一个信息时会考虑未来的情况。基于图演化博弈论的信息传播模型根据更新规则使用适应度来选择动作,而适应度仅与当前的回报有关,与未来的回报无关。因此基于图演化博弈论的信息传播模型中用户只考虑现在而忽略了未来。并且基于图演化博弈论的信息传播模型的泛化能力较差。基于图演化博弈论的信息传播模型使用更新规则描述用户与邻居的交互。更新规则本质上是用户对邻居的动作以适应度为权重进行模仿和复制,同时为了便于分析,更新规则往往具有简明的数学表达式。这为图演化博弈理论带来了坚实的数学基础,同时也限制了图演化博弈理论的泛化性和表示复杂用户交互的能力。因此,现在亟需一种社交网络信息传播范围预测方法及系统来解决上述问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种社交网络信息传播范围预测方法及系统。
第一方面,本发明实施例提供了一种社交网络信息传播范围预测方法,包括:
社交网络中用户与周围邻居的交互作为目标问题,构建决策网络模型;
基于多智能体强化学习训练好的决策网络模型,预测社交网络中的信息传播范围。
进一步地,所述社交网络中用户与周围邻居的交互作为目标问题,构建决策网络模型,包括:
基于社交网络中用户与周围邻居的交互作为目标问题,构建双层的全连接神经网络,其中,输入是邻居中选择动作f的比例,输出是选择动作f的概率和选择动作n的概率。
进一步地,所述方法还包括:
对所述决策网络模型进行训练,得到训练好的决策网络模型。
进一步地,所述对所述决策网络模型进行训练,得到训练好的决策网络模型,包括:
对社交网络初始化,并获取观测值、动作对序列和回报序列;
基于策略梯度法更新中心节点的决策网络参数,并对非中心节点的决策网络参数进行软更新,在循环执行预设次数之后,得到训练好的网络模型参数。
进一步地,所述基于多智能体强化学习训练好的决策网络模型,预测社交网络中的信息传播范围,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010682101.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置