[发明专利]一种基于随机生长的社交网络关键转发者检测方法在审
申请号: | 202210633858.6 | 申请日: | 2022-06-06 |
公开(公告)号: | CN115033804A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 殷茗;周文博;宋志昕;姚王梓;胡季傲;杜熙;琚翔;邓乐 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/35;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 西安匠星互智知识产权代理有限公司 61291 | 代理人: | 陈星 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 生长 社交 网络 关键 转发 检测 方法 | ||
1.一种基于随机生长的社交网络关键转发者检测方法,其特征在于:包括以下步骤:
步骤1:设置数据集标签:
从社交平台上获取源数据集R,所述源数据的特征参数包括推文特征和推文作者特征;
计算源数据中每条推文的重要性评分GII:
其中MIIj为推文作者ui发布的推文vj的影响力,计算公式如下:
MIIj=UII*TIIj
其中UII表示根据推文作者的特征计算得到的影响力,TIIj表示根据推文的特征计算得到的影响力;
步骤2:构建级联;
构建节点集合V:根据推文Id和推文的一对一映射关系,获得代表推文的节点集合V={v1,v2,v3,…,vn},其中n为推文的数量,vi表示V中第i个节点即第i篇推文,vj为第j篇推文;
构建边集合E:根据推文彼此之间的转发关系,获得代表推文转发关系的边集合E={eij|0im,0jm},其中m为转发事件的数量,如果推文vi的上级推文Id与推文vj的Id相等,则vj为vi的父推文或者父节点,存在eij∈E,代表vi与vj之间存在转发关系;
根据构建的边集合E,获得n*n的邻接矩阵Adj,所述邻接矩阵Adj为源数据集R所构建的转发级联,邻接矩阵Adj中的元素满足公式:
邻接矩阵Adj的第i行向量[ai1,ai2,ai3,…,ain]代表节点集合V中第i篇推文vi的被转发信息:如果aij=1,那么节点集合V中第j篇推文vj转发了推文vi,推文vj有一条指向vi的有向边;
将源数据集R中的推文按照步骤1中计算出的重要性评分从大到小排序,取前A条推文构成初始数据集F,并对这A条推文打上标签1,源数据集R中的其他推文打上标签0;根据初始数据集F中的推文,利用源数据集R所构建的转发级联,通过初始数据集F中的推文Id和上级推文Id构建出若干个转发级联Gi,且每个转发级联都有对应的根节点ri;
步骤3:数据集随机生长:
根据初始数据集F构建的多个转发级联Gi,从数据集R-F中找出能够连接所述转发级联Gi的节点所对应的推文Nk,并将推文Nk加入到初始数据集F中,使所有转发级联Gi生长为一个整体转发级联G′,且对应的初始数据集变为完整初始数据集F′;
根据整体转发级联G′,从数据集R-F′中随机选择部分推文SNi,直接添加进入整体转发级联G′作为新的节点,生成增广转发级联GZ,并对应形成中间数据集M,其中完整初始数据集F′和随机生长的数据集M-F′的推文数量比为B;
根据增广转发级联GZ,从数据集R-M中随机选择部分推文添加进入增广转发级联GZ作为新的节点,生成最终转发级联GF,并对应形成最终数据集L,其中完整初始数据集F′和随机生长的数据集L-F′的推文数量比为C;
步骤4:模型训练:
将所述最终数据集L的前D个推文携带标签,剩余推文不携带标签,并作为训练集投入图卷积神经网络进行半监督训练;
步骤5:将待检测的数据集投入训练好的图卷积神经网络中,输出数据集中每条推文的标签,根据标签判断推文是否为关键推文;统计待检测的数据集中的每位作者发布的推文数量以及其中关键推文数量,得到关键推文占比Rate,根据关键推文占比确定关键转发者。
2.根据权利要求1所述一种基于随机生长的社交网络关键转发者检测方法,其特征在于:步骤1中,推文特征和推文作者特征为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210633858.6/1.html,转载请声明来源钻瓜专利网。