[发明专利]基于图神经网络的交互式社区搜索方法及装置在审
申请号: | 202110147855.7 | 申请日: | 2021-02-03 |
公开(公告)号: | CN112966165A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 高军;陈嘉尊;王佳 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06K9/62;G06N3/04 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 陈艳 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 交互式 社区 搜索 方法 装置 | ||
本发明公开了一种基于图神经网络的交互式社区搜索方法及装置,依据用户的查询节点和标记节点构造给定候选子图GS;通过给定候选子图GS构造图神经网络模型M;对图神经网络模型M进行收敛,得到各节点的图神经网络分数,并依据图神经网络分数,更新给定候选子图;依据更新后的给定候选子图及设定社区大小k,选取最终目标社区。本发明通过在线网络中动态采集的子图来定位目标社区,利用图神经网络将社区成员关系问题重构为节点分类问题,并引入一个k大小的社区来描述目标社区,能够灵活地结合内容和结构特征来捕获图节点与标注节点之间的相似性与差异性,以迭代和交互的方式搜索出准确率高、大小精确的社区,且利用排序损失减轻用户负担。
技术领域
本发明属于信息技术领域,尤其涉及一种基于图神经网络的交互式社区搜索方法及装置。
背景技术
社区搜索是网络分析的重要工具,在线上社交网络中搜索一个包含给定查询节点的社区,在推荐、团队组织等方面有着广泛的应用。它的目标是寻找包含查询节点的密集连通子图。发现的社区可以作为一个有效的候选集,用于如商品/朋友推荐、非法组织发现等应用。
虽然这个问题已经得到了很好的研究,但目前的方法在应用于现实社会网络时仍面临挑战。首先,几乎所有这些方法都假设数据已经被抓取过,它们只对收集到的数据进行分析。但是,我们不能将数据抓取和社区搜索清晰地分开。每天在网络上都会出现大量新活跃账户和信息,如果不控制收集政策,网络爬虫会发现大量的无关紧要的数据,带来不必要的存储、网络传输、计算等资源消耗。
其次,现有的方法大部分利用规则度量社区成员,有些社区结构关系较为紧密,现有的社区搜索模型(例如文献Xin Huang,Hong Cheng,Lu Qin,Wentao Tian,and JeffreyXu Yu.2014.Querying k-truss community in large and dynamic graphs.InSIGMOD.1311–1322、文献Mauro Sozio and Aristides Gionis.2010.The community-search problem and how to plan a successful cocktail party.In SIGKDD.939–948与文献H.Wang Y.Lu W.Cui,Y.Xiao and W.Wang.2013.Online search of overlappingcommunities.In SIGMOD)可以捕捉到这一点,但结构关系较弱、内容相似度较高的社区定位具有一定的挑战性。例如,同一公司的用户可能在网络中大致采取分层形式,网络结构关系相对稀疏,但用户的内容特征相似,因此社区搜索具有灵活性,几乎不可能直接使用预定义的社区规则生成高质量的社区。此外,如果使用现有的基于规则的方法来逐步寻找社区,会带来沉重的负担。一般情况下,用户需要根据每次结果反馈调整结构约束中的参数,选择具有代表性的属性,平衡内容与结构特征之间的权重,但考虑大量内容关键字及其复杂的关系,规则调整会带来更多的挑战。
图神经网络通过同时捕获内容特性和结构关系来用来学习节点的高维表示。图神经网络通过将内容和结构特征编码成函数来实现这一目标,并在监督或非监督训练信号的指导下对函数进行优化。通过将社交网络中各个节点发布的消息作为内容特性以及将互动(关注,转发,评论等)作为边,利用图神经网络可以更准确地反映出社交网络中不同节点之间的关系。
在大型社交网络中的社区搜索是研究和工业领域关注的对象。有效地利用社交网络中各种信息,如结构、内容,并将它们灵活地组合起来,是解决上述问题的关键所在。现有社区搜索方法,更加侧重于结构,忽略了内容信息,而内容在社区搜索的研究中是不可忽略的,而且社区大小不可控。另外,现有方法多为在整个图上分析,这对于真实社交网络的场景不太适用,也一定程度上制约了社区搜索的应用。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110147855.7/2.html,转载请声明来源钻瓜专利网。