[发明专利]一种基于深度学习的社区发现方法在审
申请号: | 201810408837.8 | 申请日: | 2018-04-26 |
公开(公告)号: | CN108596264A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 石文峰;商琳 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06Q50/00 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 社区发现 预处理 非线性特征 相似度矩阵 方式构建 划分结果 聚类算法 损失函数 特征输入 训练网络 第一层 稀疏性 正则化 卷积 学习 邻居 输出 社区 | ||
1.一种基于深度学习的社区发现方法,其特征在于,包括以下步骤:
步骤1,数据预处理:通过考察网络数据间的联系,定义节点间相似性与两个节点的最短路径长度负相关和共同的邻居节点个数正相关,得到相似度矩阵;
步骤2,提取网络特征:构建深度学习网络,并使用其提取网络的结构特征矩阵;
步骤3,使用聚类算法对提取到的网络的结构特征进行聚类,得到社区发现的结果。
2.根据权利要求1所述的方法,其特征在于,步骤1包括以下步骤:
步骤1-1,输入数据为网络的邻接矩阵A∈RN×N,即邻接矩阵A是一个N×N的实数矩阵RN×N,N为网络中节点个数,两个节点相连则表示两个节点相邻,互为邻居节点;
步骤1-2,定义节点i和节点j之间的距离dis(i,j)为两个节点间的最短路径;
步骤1-3,定义com(i,j)为节点i和节点j之间共同邻居节点的个数;
步骤1-4,定义节点i和节点j的相似度为sim(i,j),采用下式计算:
sim(i,j)=αe1-dis(i,j)+γ(1-e-com(i,j)),
其中α和γ是权重因子,用来衡量两部分所占比重,e是一个数学常数,为自然对数函数的底数;
最后得到相似度矩阵X,该矩阵的第i行第j列元素xij=sim(i,j)。
3.根据权利要求2所述的方法,其特征在于,步骤2包括以下步骤:
步骤2-1,将步骤1得到的相似度矩阵X,作为输入层X输入到深度学习网络中;
步骤2-2,对输入层X进行二维卷积操作,分别用K个卷积核和K个偏置进行卷积,得到K个特征映射feature maps,即:
Hk=σ(Wk*X+bk),
其中,Hk为第k个特征映射feature maps,Wk为第k个卷积核,bk是第k个偏置,为一个实数,σ(.)为激活函数,此处激活函数选择为ReLu函数(线性整流函数);
步骤2-3,得到全部K个特征映射k取值为1~K,Hk∈RN×N,即Hk是一个N×N的实数矩阵;定义是第k个特征映射的第i列,则然后将得到的k个特征映射的每一列映射到一列上,得到一个和输入同样大小的矩阵T,其中每一个节点对应的n维向量,即矩阵T的一列ti如下式计算:
其中,k表示第k个特征映射,表示第k个权值矩阵,dH∈RN×1表示输出层的偏置,σ(.)为激活函数,此处激活函数选择为ReLu函数(线性整流函数);
步骤2-4,为了学习得到深度学习网络的潜在特征需要最小化输入数据X和输出数据T的差距L(X,T),通过训练,而优化参数使得T能够最大化的拟合原始的输入数据,如下式:
其中,Lφ(X,T)是用来测量误差的距离函数,此处选择欧氏距离;为第k个卷积核,卷积核的大小为m×m;xm×m则为对应于卷积核的输入;i表示第i列数据,N表示总数为N,即矩阵总共有N列,xi表示输入矩阵X的第i列,ti表示输出矩阵T的第i列;
步骤2-5,由于K个隐藏层中含有大量参数,需要在损失函数中增加稀疏性限制,使用KL散度,即相对熵作为稀疏性限制:
其中,p是一个接近于0的常数,使用pk来表示隐藏层的平均活跃度,KL(p||pk)表示分别以p和pk为均值的两个变量之间的相对熵;
步骤2-6,为了防止过拟合并减少模型复杂度,在损失函数上添加L2正则,最终的损失函数为:
其中β和λ为平衡各个部分权重的超参,||.||2为变量的2范数;
步骤2-8,采用堆叠的策略构建深度学习网络:第n层的输入是第n-1层的K个隐藏层对应求和之后的矩阵X(n),最终输出结果为网络的结构特征矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810408837.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种相册图片归类方法
- 下一篇:基于文本描述信息和生成对抗网络的视频生成模型