[发明专利]基于禁止节点感知的搜索方法和系统在审
申请号: | 202210055745.2 | 申请日: | 2022-01-18 |
公开(公告)号: | CN114417111A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 王朝坤;竺俊超 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 郭晓迪 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 禁止 节点 感知 搜索 方法 系统 | ||
本公开提出一种基于禁止节点感知的搜索方法和系统,包括:获取由多个节点以及节点间交互关系组成的社区网络;按照计算网页权威值的方法为社区网络中的节点和节点间的交互关系赋予权值;用预设禁止节点敏感性阈值将所有权值小于阈值的节点从社区网络中移除;将剩余节点按照权值大小降序排列;按照权值降序顺序,逐个向社区网络中加入节点,并计算每次加入时社区网络对应的加权导出度;加权导出度最小的那个时刻对应的社区即为社区搜索的最终结果,能够帮助人们在有禁止节点的情况下找到更准确的社区结果。
技术领域
本公开实施例涉及计算机网络应用技术领域,尤指一种基于禁止节点感知的搜索方法和系统。
背景技术
在计算机科学、生物学、社会学等领域,存在着大量由节点和节点间的连接关系形成的网络结构。在网络相关的研究中,社区(community)受到人们的持续关注。社区一般指一个内部节点间联系相比于社区内部和外部的节点间联系更加紧密的子图。网络中挖掘出的社区结构有助于人们完成好友推荐,犯罪团伙识别以及蛋白质功能预测等一系列任务。社区搜索问题指的是给定网络中一个或多个节点,寻找包含它们的社区。
目前的社区搜索方法主要包括基于特定拓扑结构的方法和综合考虑拓扑结构与节点属性的方法。其中典型的拓扑结构包括k-core和k-truss等。k-core结构要求社区内每个节点的度数不小于k而k-truss要求每条边所在的三角形个数都不小于k-2。综合考虑拓扑结构和节点属性的方法大多综合考虑节点属性上的相似度,例如AGAR方法就是根据节点间的属性相似度先对原图进行边的补充,从而构建一个TA-graph,在此基础上上依据k-truss结构进行社区搜索,最终得到包含给定节点的社区。这些方法的重点在于如何定义社区的紧密结构以及如何处理节点属性,却未考虑人们对社区除了包含必要节点以外的约束。
事实上,已有的社区搜索方法只能寻找包含给定节点集的社区,却不允许人们对社区中的节点进行更多约束。而在实际应用场景中,人们也会希望搜索到的社区结果不包含某些给定节点,即禁止节点。禁止节点在现实活中可以对应黑名单中的人物或者被标记为不喜欢的商品等等,然而现有的方法对此缺少支持。为此,本发明实施例旨在提供一种基于禁止节点感知的搜索方法。
发明内容
为解决上述技术问题,本公开提出了一种基于禁止节点感知的搜索方法,包括:
获取由多个节点以及节点间交互关系组成的社区网络;
按照计算网页权威值的方法为社区网络中的节点和节点间的交互关系赋予权值;
用预设禁止节点敏感性阈值将所有权值小于阈值的节点从社区网络中移除;
将剩余节点按照权值大小降序排列;
按照权值降序顺序,逐个向社区网络中加入节点,并计算每次加入时社区网络对应的加权导出度;
加权导出度最小的那个时刻对应的社区即为社区搜索的最终结果。
进一步的,所述按照计算网页权威值的方法为社区网络中的节点和节点间的交互关系赋予的权值表示节点和节点间交互关系相对于预设黑节点的疏远程度。
进一步的,所述按照计算网页权威值的方法为社区网络中的节点和节点间的交互关系赋予权值包括:
根据每个节点相邻的节点数量,计算其与每个相邻节点发生交互的平均概率;
根据社区网络中必须包含的节点,采用计算网页权威值获取网络中所有节点对于必须包含节点的亲近程度;
根据不允许出现在社区中的黑节点用户,通过计算网页权威值的方法获取网络中所有节点对于黑节点的亲近程度;
将每个节点最终相对于黑节点的疏远程度的取值进行规范化,使其取值落在0到1之间,社区必须包含的节点对应的取值默认设置为1,黑节点用户对应的取值默认设置为0,计算其余节点最终权重值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210055745.2/2.html,转载请声明来源钻瓜专利网。