[发明专利]一种赛博平台经济网络中用户影响力检测方法在审
申请号: | 201810497041.4 | 申请日: | 2018-05-22 |
公开(公告)号: | CN108764323A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 谢莹;江丹;许荣斌;汪欣梅 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 董芙蓉 |
地址: | 230601 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大规模数据 用户影响力 影响力行为 用户节点 网络 检测 关键路径 监测能力 监测用户 社交网络 网络构架 网络领域 信息监测 映射矩阵 预测性能 变化率 有效地 低维 降维 维度 稀疏 应用 变形 关联 监测 优化 | ||
1.一种赛博平台经济网络中用户影响力检测方法,其特征在于:所述赛博平台经济网络中用户影响力检测方法包括以下步骤:
步骤一,使用数据收集器收集节点信息,并使用数据选择器去分离所有的带标签节点和无标签节点;提炼网络数据后,使用{0,1}来表示节点间的关系,由此获得关系矩阵;
步骤二,降低平台经济网络协作用户数据维度;利用带标签节点和无标签节点之间的距离求取内积矩阵,进一步求出最大关系矩阵,利用关系矩阵Z构造邻接矩阵,再对邻接矩阵进行特征值分解,得到一个低维矩阵;
步骤三,采用H指数的变形指数和最关键路径变化率构建的公式M来求出节点的影响力大小,选出M值最大的个节点,作为社团的初始中心点;
根据模块度函数来构造适用于大规模数据的分类器,再综合计算每个样本节点的用户行为影响力,计算该样本节点与所有邻居节点的相似性;
步骤四,通过Macro-F1和Micro-F1敏感性发现该模型的性能,根据Ent(V)的值的大小,判断V的纯度,衡量用户影响力行为检测系统的性能,实现大规模的赛博平台经济网络用户影响力行为监测。
2.如权利要求1所述的赛博平台经济网络中用户影响力检测方法,其特征在于:所述赛博平台经济网络中用户影响力检测方法包括:
在数据收集模块中,利用数据收集器收集一组数据集:平台经济网络G=(V,E,C)其中是原始数据集,n是原始数据节点的个数;E={e1……eσ}∈RN是边集的集合,σ是边的个数;是各个社团类集,是社团聚类个数;
在数据选择器模块中,将原始数据节点V分为带标签数据集B和无标签数据集X;设定在网络中有标签的用户节点个数为m,进而无标签用户节点个数l=n-m,其中n>>m;带标签数据集和无标签数据集X={x1LLxl}∈RN;
在关系构建模块中,s即是第i个无标签样本节点xi与第j个带标签样本bj之间的距离,其中i或j是从1到n中的任意一个数字。公式(3)计算无标签样本节点与带标签样本节点在本平台的大型无向图中联系最大化,由无标签样本节点与带标签样本节点之间的联系和两个节点之间的距离求得;
定义Z∈Rn×m,zij是定义在无标签样本xi和有标签样本bj之间的联系,采用公式(2)计算出节点之间的联系;
γ是正则化参数
在数据维度约减模块中,使用非负稀疏矩阵Z去设计非负邻接矩阵A∈Rn×n:
A=ZΔ-1ZT (4);
其中Δ∈Rm×m是对角矩阵,第j列对应的值由获得。非负邻接矩阵A由上述计算得到以后,为去除一些无意义的边关系,故将A特征值分解为:
A=FΛFT (5);
其中Λ∈Rn×n=diag(λ1,…,λn),λ1≥…≥λp>0=λp+1=…λn是A的特征值,F∈Rn×n是特征值向量矩阵。所以A可以进一步表示为且
其中Fp∈Rn×p是矩阵F的前p列,Λp∈Rp×p=diag(λ1,…λp)特征向量的前p列。定义W,是原始数据到矩阵Fp的低维映射矩阵,利用公式(7)求出最小W.
a正则化参数在构建模型时输入;
在判别学习模块中,进行社团聚类,结合H指数的变形指数和模块度函数来进行分类,构建影响力监测器;
指数指当有h个邻居节点且这h个邻居节点自身也至少有h个邻居节点,这个h值就是该节点的指数;公式(8)表示为vi这个节点的指数,使用表示vi这个节点的h值除以节点个数的2倍,等价于用低维映射矩阵W中节点vi所属第j列中1的个数之和,除以节点个数的2倍;公式如下:
其中p是特征矩阵Λp的列数。
最关键路径变化率θ(vi),是指在无向图中所有节点所通过的路径中对最短路径影响最大的节点,对于这个关键点的评判使用如下:
其中θf是在除去vi这个节点之前的最短路径长度之和,θl是在除去vi这个节点之后的最短路径长度之和;其中θ(vi)越大说明这个节点的影响力越大,越靠近网络中心;使用度量节点影响力的评价公式:
选出M值最大的个节点,作为社团的初始中心点。之后找出邻居节点,将邻居节点分别与初始社团聚类,计算社团聚类以后Q值的变化,即ΔQ值,取ΔQ值最大的那个节点于社团合并;如果同时被多个社团合并,则与ΔQ值最大的那个社团合并,其他社团取ΔQ第二大的点与其合并,以此类推,直到所有节点都聚类到社团中去或者ΔQ值不再变化;
模块度函数:
式中ci表示第i个节点所属的社团;ki是第i个节点的度值,Aij是该网络对应的邻接矩阵的元素,第i个和第j个节点相连是为1,不相连是为0;第i个和第j个节点在相同的社团时(ci,cj)=1,在不同社团时为0;是该网络中边的数目总和,σ是边的个数;指网络中第i个和第j个节点之间可能的边数。
综合节点的结构属性和内在属性共同计算节点间的相似性
在评价模块中,对于实验所用数据集,通过Macro-F1和Micro-F1发现对于数据集最优的维度:
其中
其中基于信息熵理论第η类样本所占的比例为Ent(V)的值越小,则V的纯度越高,衡量用户影响力行为检测系统的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810497041.4/1.html,转载请声明来源钻瓜专利网。