[发明专利]一种图嵌入向量的生成方法及基于图嵌入的社区发现方法在审
申请号: | 202110079198.7 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112765414A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 于东晓;张喜连;罗琦 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906;G06F16/9536;G06F40/284;G06K9/62 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 马千会 |
地址: | 250013 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 嵌入 向量 生成 方法 基于 社区 发现 | ||
1.一种图嵌入向量的生成方法,其特征在于,包括:
获取顶点的核值;
获取顶点的邻域结构信息,计算顶点之间的相似度;
基于顶点与其相邻邻居的相似度,生成顶点序列;
将顶点序列进行词向量训练,生成每个顶点的嵌入向量。
2.根据要求1所述的图嵌入向量的生成方法,其特征在于,所述顶点核值的计算方法为:
计算所有顶点的度数;
选择一个度数最小的顶点,其核值即为其度数的值;
遍历上一步骤中顶点的邻居,若某一邻居顶点的度数大于该顶点的的度数,则邻居顶点的度数减1。
3.根据要求2所述的图嵌入向量的生成方法,其特征在于,所述顶点之间相似度的计算方法为:
获取顶点u的k跳邻居集合
分别获取集合中顶点u邻居顶点的核值分布情况其中表示中核值为t的顶点有多少个;
将顶点u的每一跳邻居集合的向量分别乘以一个衰减系数加起来,整合成一个总的向量du;其中,跳数越大,即k越大,说明这个邻域信息对该顶点的邻域结构情况影响越小,因此,衰减系数越小;
计算顶点u和顶点v对应的向量之间的欧氏距离,进而计算两个顶点之间的相似度。
4.根据要求3所述的图嵌入向量的生成方法,其特征在于,顶点序列的生成方法为:
根据顶点之间的相似度,计算由一个顶点游走到其相邻顶点的概率;
以得到的概率作为预设转移概率,使用随机游走模型生成顶点序列。
5.一种基于图嵌入的社区发现方法,其特征在于,包括:
获取训练样本集;
获取每个训练样本所对应的图嵌入向量,其中,所述图嵌入向量采用如权利要求1-4任一项所述的方法生成;
将所述训练样本的图嵌入向量作为输入数据,对预设网络模型进行训练,以得到社区发现模型。
6.根据权利要求5基于图嵌入的社区发现方法,其特征在于,所述的预设网络模型为聚类算法模型,将相似的顶点向量归纳在一起,进而得到多个不同的簇类,每一个簇类代表一个社区。
7.根据权利要求6基于图嵌入的社区发现方法,其特征在于,在训练样本的标签已知的情况下,将每个顶点向量分配到一个社区中,然后对新的顶点所属社区进行预测,完成社区发现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110079198.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复合正极极片和可充电固态电池
- 下一篇:一种可拼接集成装饰板