[发明专利]一种基于社交网络的信息传播规律挖掘方法在审
申请号: | 202011450926.2 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112686765A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 边茜茜;武南南;王文俊 | 申请(专利权)人: | 天津大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F16/9537;G06F40/216 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社交 网络 信息 传播 规律 挖掘 方法 | ||
1.一种基于社交网络的信息传播规律挖掘方法,其特征在于,结合社交网络的信息的特征和网络的拓扑结构的特征,分析信息传播事件的原因,挖掘信息传播的规律,包括如下步骤:
1)首先对社交用户的发帖信息进行预处理;
2)遍历所有的用户中的每个信息,提取信息特征,形成不同用户的发帖信息特征集合;
3)根据用户的转帖关系,构建社交关系网络,其中节点为社交用户,节点权重为关系的程度,边为社交用户的关注关系;
4)由步骤3)得到的关系网络,使用有效的信息扩散规则算法进行检测不同用户有社交行为的原因,得到信息传播的规则Q*。
2.根据权利要求1所述的一种基于社交网络的信息传播规律挖掘方法,其特征在于,其中提取信息特征:源数据中没有特征标签,因此我们需要处理数据并提取数据的特征,这些特征变量N的不同值将用作特征命题q;
N1:社交用户是否已知道信息,假定社交用户知道邻居及其行为,并且仅通过邻居知道信息;当社交用户v的邻居节点对于同一信息的社交行为Bl超过阈值θ时,社交用户获知该信息;
N2:信息的主题,一条信息可以包含多个主题,信息中的每个单词都是由其中一个生成的;潜在狄利克雷分配(LDA)模型可以计算信息和主题,主题和单词的概率依赖性矩阵,并找到每个信息的最大概率的主题和概率排名中前k个单词;
N3:信息情感,标记信息的情感倾向,并将信息情感分为三类:积极的,消极的和没有明显的情感,可以使用基于词典的方式标记信息的情感倾向;
N4:信息丰富度,计算信息中特殊符号的使用,然后将信息丰富度分为两类;
N5:两个节点是否是朋友关系,变量是布尔变量,有真假两种取值;如果两个对同一信息有社交行为的社交用户是朋友,那变量取值为真,否则为假;
N6:社交用户的积极性,平台上社交用户的平均每周社交行为次数是否超过所有社交用户的每周平均社交行为次数,以确定社交用户是否为活跃社交用户;
N7:节点度中心性;
N8:结点紧密中心性。
3.根据权利要求1所述的一种基于社交网络的信息传播规律挖掘方法,其特征在于,由步骤3)得到的关系网络表示为G=(V,E,p),其中V={v1,...,vN}N为顶点总数,
E∈V×V为边的集合,映射函数p:V→[0,1]定义了每个顶点v的单个经验p值;
通过比较当前节点与其相邻节点的权重,计算出节点v的经验性p值p(v);
其中,{w1,…,wT}表示与节点v相连的节点,ωv表示节点v的权重;
将上述描述的经验性p值传到NPHGS非参数异构图扫描统计函数中
NPHGS非参数异构图扫描统计函数:
其中是指一组连接的顶点(即连通子图),
Nα(S)=∑v∈Sδ(p(v)≤α) (3)
如果δ(·)=1则为真,如果δ(·)=0则为假;
α表示显著水平,即p(v)≤α就视为异常,所以Nα(S)表示在显著水平α下,图S中节点异常的连通子图;
需要满足两个属性:
是随着Nα(S)单调递增;
是随着N(S)-Nα(S)单调递减;
为满足这两个属性,考虑Berk-Jones(BJ)统计量;
其中,KL是p值小于α的观察比例与预期比例之间的Kullback-Leibler散度;
其中,显著性水平α可以在0和某些常数αmax(αmax1)之间进行优化,重要的是要考虑NPHGS中的α范围,而不是重要性的单个阈值;
在实践中,αmax的选择要略大于用户预先定义的典型显着性水平,这里我们使用αmax=0.15;
对非参数扫描统计函数找出最异常V的连通子图,可以形式化为以下优化问题:
可以看出,上述优化问题精确解的时间成本在最坏情况下,图节点总数|V|是指数的,因此,通过删除连接性约束,以及固定α而不是让α在0到αmax之间变化可以有效地解决这个问题的松弛版本,放松问题的形式如下:
等价于:
其中,U(V,αmax)是指{αmax}与V中小于αmax的一组不同p值的并集;
因为BJ扫描统计量满足线性时间子集扫描(LTSS)属性,所以子问题:
S*=argmaxsFα(S)表示最佳连接子图,如果在v∈S*时,S*满足不存在“轮胎破裂”实体的性质;
令Fα(S)=|S|如果S中所有p值均小于或等于α,否则为0,确保算法找到最佳子图S*=argmaxsFα(S)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011450926.2/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置