[发明专利]基于图神经网络的交互式社区搜索方法及装置在审
申请号: | 202110147855.7 | 申请日: | 2021-02-03 |
公开(公告)号: | CN112966165A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 高军;陈嘉尊;王佳 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06K9/62;G06N3/04 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 陈艳 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 交互式 社区 搜索 方法 装置 | ||
1.一种基于图神经网络的交互式社区搜索方法,其步骤包括:
1)通过用户的查询节点和标记节点,从在线社交网络中构造给定候选子图GS;
2)通过给定候选子图GS的各节点构建邻接矩阵A,依据给定候选子图各样本正节点u的内容特征及预训练好的嵌入集D,构建内容特征矩阵FM,并通过交叉熵与排序损失相结合的方式作为损失函数,构造图神经网络模型M=(A,FM,W),其中A为邻接矩阵,W为参数矩阵;
3)对图神经网络模型M进行收敛,得到各节点的图神经网络分数,并依据图神经网络分数,更新给定候选子图GS;
4)依据更新后的给定候选子图及设定社区大小k,通过保证社区连通且社区中节点分数尽可能大,选取大小为k的最终目标社区。
2.如权利要求1所述的方法,其特征在于,构造给定候选子图GS的方法包括:局部边缘增强的广度优先搜索策略或广度优先搜索。
3.如权利要求2所述的方法,其特征在于,依据局部边缘增强的广度优先搜索策略,通过以下步骤构造给定候选子图:
1)每轮迭代前,查找先前候选子图GB,其中若未查找先前候选子图GB,则先前候选子图GB为空;
2)依据先前候选子图GB=(VB,EB,FB)与正样本集合Sp,计算节点集合VS=Sp∪VB、边集合ES=EB及节点内容特征集合FS=FB,其中,VB、EB与FB分别为先前候选子图GB的节点集合、边集合与节点内容特征集合,样本节点集合S包括:正样本集合Sp和标记负节点集合Sn,正样本集合Sp包括标记正节点集合和查询节点;
3)对节点集合VS中每一节点u,获得与节点u连边的节点集合N及节点u的新发布信息,将节点u的新发布信息特征加入节点内容特征集合FS中,更新节点内容特征集合FS,并继续更新节点集合VS与边集合ES,其中若节点u∈Sp且节点v∈N,则节点集合VS←VS+{v}及边集合ES←ES+{(u,v)};若节点且v∈N∧v∈VS,则节点集合VS不变,边集合ES←ES+{(u,v)};
4)根据更新后的节点集合VS、边集合ES与节点内容特征集合FS,构造给定候选子图GS=(VS,ES,FS),其中将当前候选子图GS保存以用于下次迭代。
4.如权利要求1所述的方法,其特征在于,损失函数Lossa=Lossc+λLossr,其中交叉熵损失函数排名损失函数λ为权重参数,S为样本节点集合,uS.y为节点uS的标记结果,P[uS]为节点uS的图神经网络分数,R为用户标记的一组排序节点对,(uR,vR)∈R代表u获得比v更高的图神经网络分数,v为社区网络的一节点,m∈[0,1]是允许排序误差的容忍度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110147855.7/1.html,转载请声明来源钻瓜专利网。