[发明专利]一种社交网络链路预测方法及系统在审
申请号: | 202110101233.0 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112765489A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 李博涵;张裕欣;高寒;王萌;衡雷 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00;G06N3/04;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王爱涛 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 预测 方法 系统 | ||
本发明涉及一种社交网络链路预测方法及系统。所述方法包括:获取待预测社交网络数据集;将待预测社交网络数据集分别输入不同主题下的主题感知社会影响力模型得到待预测社交网络数据集在各主题下的社会影响力概率分布;对待预测社交网络数据集所有主题下的社会影响力概率分布进行聚类,得到各主题类别下的社会影响力概率分布;将待预测社交网络数据集和各主题类别下的社会影响力概率分布输入训练好的图神经网络得到各待预测用户在不同身份下的社会影响力传播模式;将相应的两个待预测用户在不同身份下的社会影响力传播模式输入相似度函数得到相似度,并根据相似度确定两个待预测用户之间的链路预测结果。本发明提高了链路预测的准确度。
技术领域
本发明涉及数据挖掘领域,特别是涉及一种社交网络链路预测方法及系统。
背景技术
早期研究学者将链路预测问题定义为推测未连接的成员节点之间未来连接的可能性。近些年来,随着各类社交媒体的发展,社交网络中的链接预测问题受到研究学者越来越多的关注。链路预测问题是一种多项式复杂程度的非确定性(Non-deterministicPolynomial,NP)问题,优秀的链路预测方法应该能在尽可能短的时间内准确预测出社交网络中潜在的链接对象。这是一个非常复杂的问题,时间复杂度过高可能导致用户体验极差,而准确度过低将使得模型预测毫无意义。尽管研究者尝试从不同的角度解决链路预测问题,但大多数的模型方法都只关注于社交网络中的静态信息—节点属性以及社交网络拓扑结构。
节点属性是社交网络中最容易获得的信息,这些信息由用户预先提供。节点属性是用户或系统预先给定的标签信息,因此节点属性包含了丰富并且浓缩的用户特征,在链路预测的早期研究阶段节点属性是链路预测方法的主要支持信息,许多基于此的链路预测算法都具有优秀的性能。除此之外,节点属性的一致性能有效的帮助系统推测社交网络中的社交群体,这是一种非常简洁高效的方法,直到现在这种方法仍然被广泛使用。社交网络拓扑结构不同于节点属性,其只关注于用户节点的局部子图结构。拓扑结构不是人为制定的一种显示信息,而是一种隐式的关系信息。对比于节点属性,拓扑结构不需要用户预先设定也不需要系统配置相应的标签,并且拓扑结构是一种相对动态可变的信息,它能根据社交网络的变化而调整。因此,尽管利用拓扑结构进行链路预测效率明显低于使用节点属性的方法,但基于拓扑结构的方法仍然具有很强的实用性。
传统的链路预测技术大多基于节点属性或者拓扑结构,也有一部分的研究工作致力于将两种不同结构的信息融合。虽然这些研究工作都取得了一定的进展,但在实际应用场景下都存在一定限制。因为传统的链路预测技术总是假定节点属性以及拓扑结构是完全正确的,但由于社交网路的复杂性以及现实世界中的不确定性,节点属性以及拓扑结构并不真实可信。在现实生活中,可能因为一些客观因素导致节点属性标记错误或者一些链接缺失;也有部分主观因素是用户在开始对节点属性的错误判断或者刻意隐瞒存在的链接关系。总而言之,现实世界里节点属性以及拓扑结构都是不完全可信的,其真实性会直接影响到模型的判断。无论是节点属性还是节点邻域的拓扑结构都是可以被人为控制、修改以及隐藏,尽管拓扑结构是一种动态的结构但却表示的是节点之间的显式关系。因此,单纯考虑静态的显式信息(节点属性、拓扑结构)的链路预测方法在实际应用中效果不尽人意。
发明内容
本发明的目的是提供一种社交网络链路预测方法及系统,提高链路预测的准确度。
为实现上述目的,本发明提供了如下方案:
一种社交网络链路预测方法,包括:
获取待预测社交网络数据集,所述待预测社交网络数据集为待预测用户所在的社交网络拓扑结构图;
将所述待预测社交网络数据集分别输入不同主题下的主题感知社会影响力模型得到所述待预测社交网络数据集在各主题下的社会影响力概率分布;
对所述待预测社交网络数据集所有主题下的社会影响力概率分布进行聚类,得到所述待预测社交网络数据集在各主题类别下的社会影响力概率分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110101233.0/2.html,转载请声明来源钻瓜专利网。