[发明专利]基于社交上下文信息的用户转发行为预测方法有效
申请号: | 202010034448.0 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111241421B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 杨力;郭慧慧;刘泽宇;张岩 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q10/04;G06Q50/00;G06F16/951 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 社交 上下文 信息 用户 转发 行为 预测 方法 | ||
1.一种基于社交上下文信息的用户转发行为预测方法,其特征在于,包括如下步骤:
(1)收集社交网络中的数据:
(1a)随机选取社交网络中一个用户作为种子用户,并爬取该种子用户的关注用户,组成第一关注用户集合;
(1b)爬取第一关注用户集合中每个关注用户的关注用户,组成第二关注用户集合,并将种子用户、第一关注用户集合和第二关注用户集合组成用户集合U;
(1c)爬取用户集合U中每个用户vi在连续t个时间段发布的文本消息,并对所有的文本消息进行预处理,然后将前t-1个时间段发布的经过预处理所获取的分词集合作为用户的历史消息,将第t个时间段发布的M条文本消息经过预处理所获取的分词集合作为M条待预测消息,M≥500;
(2)构建每个用户的社交网络图Gi:
以用户集合U中的每个用户vi以及vi的关注用户为节点,以关注用户指向被关注用户的关注关系为有向边构建vi的社交网络图Gi,有向边对应的权重为关注用户对被关注用户所发布的文本消息的转发概率;
(3)计算用户vi的历史消息的主题概率分布和待预测消息的主题概率分布之间的JS散度JSD(Pv||Pm):
(3a)将用户vi的历史消息和M条待预测消息分别作为LDA主题生成模型的输入,计算vi的历史消息的主题概率分布Pv和每条待预测消息的主题概率分布Pm,
(3b)计算用户vi的历史消息的主题概率分布Pv与待预测消息的主题概率分布Pm的JS散度JSD(Pv||Pm):
其中,Pv(k)表示第k个主题生成用户兴趣文档的概率,Pa(k)表示Pa中的第k个概率值,∑表示求和操作,K表示LDA主题生成模型的主题个数,k=1,2,...,K;
(4)计算用户vi的成对影响力f(V,Gi)和结构影响力
(4a)以社交网络图Gi中的节点vi为出发点,沿Gi中的有向边随机游走,以第一概率随机选择与节点vi相邻的边,并沿该边移动到下一节点,或者以第二概率返回节点vi后,以下一个节点或节点vi为出发点重复随机游走过程,经过迭代直至社交网络图Gi中每个节点的概率值达到稳定状态,得到节点vi到其他节点vj,即其他节点vj对节点vi的影响力Infij的稳定概率分布;
(4b)计算用户vi的成对影响力f(V,Gi)和结构影响力
其中,V表示用户vi的关注用户节点集合,表示在第t时间段转发用户vi发布的文本消息的用户所组成的活跃邻居集合,表示用户vj转发消息与用户vi转发消息的时间差,vj∈V,a表示平衡因子参数,μ表示衰减因子参数,表示所形成的社交圈的集合;
(5)获取用户vi的社交上下文信息Xi,m:
计算用户vi的局部影响力并将和JS散度JSD(Pv||Pm)作为用户vi的社交上下文信息Xi,m:
其中,δ表示平衡f(V,Gi)和权重的参数;
(6)基于社交上下文信息Xi,m获取用户vi的转发行为的预测结果:
(6a)将步骤(1)中收集到的半数以上数据对应的社交上下文信息作为训练集,其余数据对应的社交上下文信息作为测试集;
(6b)将训练集作为逻辑回归分类模型h(X)的输入,并通过似然函数L(β),采用梯度下降法进行迭代训练,得到训练好的逻辑回归分类模型h(X)';
(6c)将测试集作为训练好的逻辑回归分类模型h(X)'的输入,对用户的转发行为进行预测,并对预测结果与预先设置的阈值进行比较,当预测结果大于等于预先设置的阈值时,则用户vi在第t时间段转发了消息m,否则,用户vi在第t时间段没有转发消息m。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010034448.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置