[发明专利]基于向量压缩与重构的社交网络特征动态提取方法在审
申请号: | 202010873148.1 | 申请日: | 2020-08-26 |
公开(公告)号: | CN112052940A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 张琛;李春奕;鱼滨;谢宇;樊一鸣;徐鑫航 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/46;G06K9/62;G06Q50/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 向量 压缩 社交 网络 特征 动态 提取 方法 | ||
1.一种基于向量压缩与重构的社交网络特征动态提取方法,其特征在于,将由时间快照生成的训练集输入到深度半监督自编码器网络中进行向量压缩,根据最大最小化训练准则交替优化生成对抗网络,在生成器中提取社交网络特征,构建生成对抗网络对社交网络进行特征向量重构;该方法的步骤包括如下:
(1)生成训练集:
(1a)在不同的30种节点社区中选取累计分布的至少1000个网络节点,每个网络节点在至少3个月的时间内存在2条与其他网络节点连接的边,且所有网络节点形成至少50000条边数,将节点社区、网络节点、网络节点构成的边和时间标签四种数据类型构成社交网络数据集;
(1b)将每条边按时间标签对社交网络数据集进行快照划分,得到每个时间间隔内由节点社区、网络节点和边三种数据类型构成的时间快照,对每个时间快照进行图数据建模处理得到快照图,将建模后的所有快照图构成训练集;
(2)构造深度半监督自编码器网络:
(2a)搭建一个7层的深度半监督自编码器网络,其结构依次为:输入层→第1全连接层→第2全连接层→输出层→第3全连接层→第4全连接层→解码重构层;其中,输入层与解码重构层基于网络层的参数维度对称,第1全连接层与第4全连接层基于网络层的参数维度对称,第2全连接层与第3全连接层基于网络层的参数维度对称;
(2b)设置深度半监督自编码器每层参数:
将第1、2、3、4全连接层的维度依次设置为1000,100,100,1000;
将输出层的输出维度设置为64;
每层的激活函数均使用sigmoid函数;
(3)构建生成对抗网络:
(3a)搭建一个由输入输出层、全连接层、分类层的生成器网络;将输入输出层的维度设置为64;输入输出层与全连接层均使用sigmoid函数,分类层采用softmax激活函数;
(3b)搭建一个由第1全连接层、第2全连接层、分类层的判别器网络;将第2全连接层和分类层的维度分别设置为64、1;激活函数均使用sigmoid函数;
(3c)将生成器网络的分类层与判别器网络中的第1全连接层相连组成生成对抗网络;
(4)训练网络:
(4a)将训练集中的每个快照图依次输入到深度半监督自编码器网络中,用梯度下降法更新网络的权值,直到深度半监督自编码器网络的损失函数收敛为止,输出层输出每个快照图的压缩向量;
(4b)从所有压缩向量中依次选取一个压缩向量;
(4c)将所选压缩向量输入到生成对抗网络生成网络中,在生成器网络的全连接层加入至少100个随机噪声,得到经生成器网络分类层softmax函数处理后带有噪声的一个假样本;
(4d)将所选的压缩向量的下一个压缩向量对应的快照图作为真样本,从真样本与假样本中各自随机选取100个样本进行混合,将混合样本输入到判别器网络中第1全连接层,经判别器网络对混合样本进行分类得到分类损失值;
(4e)利用分类损失值,根据最大最小化训练准则对生成对抗网络中的判别器网络和生成器网络进行交替训练,分别更新生成器网络中和判别器网络每一层的权重值,直到分类损失值满足阈值区间,停止训练;
(4f)判断是否选完所有压缩向量,若是,则执行步骤(4g),否则,执行步骤(4b);
(4g)得到训练好的生成对抗网络;
(5)将动态社交网络的快照图输入到训练好的生成对抗网络中,输出社交网络的特征向量。
2.根据权利要求1所述的基于向量压缩与重构的社交网络特征动态提取方法,其特征在于,步骤(1a)中所述与其他网络节点连接的边指的是,将社交网络中的每个用户作为一个网络节点,网络节点之间边的形成为以下三种情况中的任意一种:若两个用户之间为好友关系的情况,则对应的两个网络节点连接形成边;若两个用户共同关注同一个文章或博主或专栏推送内容的情况,则对应的两个网络节点连接形成边;若两个用户之间成功发送了聊天内容、电子邮件或者留言回复的情况,则对应的两个网络节点连接形成边。
3.根据权利要求1所述的基于向量压缩与重构的社交网络特征动态提取方法,其特征在于,步骤(1b)中所述的对社交网络数据集进行快照划分指的是,每条边形成的时间对应一个时间标签,时间标签单位为毫秒,按年或月对时间标签内的边进行快照划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010873148.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种薄板数控加工夹具
- 下一篇:一种输液管道的液体检测系统