[发明专利]一种基于深度哈希的符号社交网络嵌入方法有效

申请号：	201910468680.2	申请日：	2019-05-31
公开（公告）号：	CN110210988B	公开（公告）日：	2021-04-27
发明（设计）人：	毛先领;郭佳楠;姜晓健;孙英翔;黄河燕;牟其林;邹佳	申请（专利权）人：	北京理工大学;中电科大数据研究院有限公司
主分类号：	G06Q50/00	分类号：	G06Q50/00
代理公司：	北京正阳理工知识产权代理事务所(普通合伙) 11639	代理人：	唐华
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度符号社交网络嵌入方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度哈希的符号社交网络嵌入方法，其特征在于，包括以下步骤：

从公共数据集中，分别选取稀疏网络Slashdot和稠密网络Epinions，作为实验数据集，分别进行数据收集阶段、训练阶段和测试阶段的处理；具体如下：

步骤一、数据收集阶段：

步骤1：从实验数据集中，抽取每条边及边权，构成边集ε；

其中，边集ε＝{(v_i，v_j，e_ij)}，v_i、v_j表示网络中的节点，边权e_ij∈{1，-1}表示正边和负边，正边条数为NP，负边条数为NN；

步骤2：根据边集ε，获得三元组集合e_ij＝1，e_jk＝-1；方法如下：

步骤2.1：根据边集ε中正边和负边信息，分别构建正边图和负边图；其中，正边图表示原网络去除所有负边后的结构，相反可得到负边图；

步骤2.2：从正边图和负边图中，提取三元组(v_i，v_j，v_k)，v_k表示负边图中与v_i相邻的所有节点，具体如下

步骤2.2.1：分别选取正边图中每个节点v_j；

步骤2.2.2：从正边图中，选取与v_j相邻的所有节点v_i；

步骤2.2.3：判断v_i是否出现在负边图中，若v_i出现在负边图中，则从负边图中选取与v_i相邻的所有节点v_k，并将(v_i，v_j，v_k)存入集合若v_i未出现在负边图中，则将(v_i，v_j，v₀)存入集合令数据集其中，v₀为设立的虚拟节点，当节点v_i无负边时，假设其与节点v₀以负边连接；

步骤二、进行训练：

步骤3：初始化HSNE模型中的所有参数θ；

其中，HSNE为深度哈希模型，由三部分相同且共享参数的深度哈希模型HSNE_i组成；HSNE_i包括网络特征学习、哈希码学习和损失函数；

网络特征学习：由Embedding层和三个全连接层组成，Embedding层维度为d₀，三个全连接层维度为d_i；

哈希码学习：由一个全连接层和量化层组成，全连接层的维度为d；

模型的全连接层均以双曲正切函数tanh为激活函数；

步骤4：为控制模型规模，选取mini-batch大小为B；对数据集按大小划分mini-batch，对每个mini-batch，做如下训练：

步骤4.1：将输入HSNE模型，获得输出

步骤4.2：对输出进行量化，得到按照损失函数计算损失：

其中，表示模型的输出；θ表示模型参数；x₀表示上述v₀经模型的输出；种为步骤一所述的数据集；表示任意节点v_i和v_j对应的哈希码之间汉明距离，Θ_ik表示节点v_i和v_k对应的哈希码之间汉明距离，Θ_io表示节点v_i和v_o对应的哈希码之间汉明距离；M表示网络中节点总个数，则x_m表示网络中v_m节点经模型的输出；表示步骤4.2量化结果，b_m＝sgn(x_m)；表示矩阵2-范式的平方；δ，δ₀，α，η表示模型的超参数；