[发明专利]基于融合属性的社区发现方法、系统、装置及存储介质有效
申请号: | 202110460559.2 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113158080B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 汤庸;徐青;林荣华;陈万德;毛承洁;张妮妮;顾文静 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F40/242;G06F40/289 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510631 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 融合 属性 社区 发现 方法 系统 装置 存储 介质 | ||
本发明公开了一种基于融合属性的社区发现方法、系统、装置及存储介质,其中所述方法包括:根据节点的连接关系确定拓扑矩阵,根据节点的属性确定相似度矩阵,将拓扑矩阵分解为社区矩阵和第一矩阵,将相似度矩阵分解为节点矩阵和第二矩阵,确定第一损失函数和第二损失函数;根据社区矩阵和节点矩阵确定转移矩阵,确定第三损失函数;利用第二矩阵和相似度矩阵调节社区矩阵,确定第四损失函数;根据第一损失函数至第四损失函数确定总损失函数,并确定社区矩阵,确定社区结构。本申请实施例利用转移矩阵及反馈机制融合节点拓扑结构和属性,提高节点结构和节点属性的融合度,具有较强的鲁棒性;另使用相似度矩阵代替传统的属性矩阵,解决矩阵稀疏问题。
技术领域
本申请涉及数据挖掘技术领域,尤其涉及一种基于融合属性的社区发现方法、系统、装置及存储介质。
背景技术
社交网络在互联网及其相应服务的高速发展下得到了全面普及,用户在社交网络上进行便捷的信息交流及信息共享,用户行为数据的不断丰富使社交网络相关各个领域的研究变得急切且必要,其中一个重要的方向是检测和提取网络的社区结构,称为社区发现。在实际场景中,大型的复杂网络上节点之间关系复杂,不同的社交网络下,比如学术社交网络与日常生活分享社交网络的特征差异巨大,因此提出一种对各种类型的社交网络都有较好适应性的社区发现算法是很有必要的。
而在社交网络中,各个节点之间的拓扑关系普遍用无向图来表示,而无向图用对称的邻接矩阵来存储,因此非负矩阵分解算法在研究社区发现问题上有其天然的直观性和优势。相关技术中,社区发现领域的非负矩阵分解算法主要集中在针对节点拓扑矩阵进行研究,未考虑节点本身的属性信息,或者是简单融合节点属性和节点拓扑矩阵的关系,这类算法的主要缺点是未能对节点属性和拓扑矩阵进行自适应的融合,对于拥有多种社区类型的大型复杂的社交网络并不友好。另外,在复杂社交网络中,为保证数据的多样性,属性字典不宜太小,但随着丰富的字典而来的问题是属性矩阵稀疏,影响算法效果与效率。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种基于融合属性的社区发现方法、系统、装置及存储介质。
第一方面,本申请实施例提供了一种基于融合属性的社区发现方法,包括:根据社交网络的节点链接关系确定拓扑矩阵;根据所述社交网络的节点属性确定相似度矩阵;将所述拓扑矩阵分解为社区矩阵和第一矩阵的乘积,并确定第一损失函数;其中所述社区矩阵和所述第一矩阵互为转置矩阵;将所述相似度矩阵分解为节点矩阵和第二矩阵的乘积,并确定第二损失函数;其中所述第二矩阵为属性矩阵的转置矩阵;根据所述社区矩阵和所述节点矩阵的映射关系,确定转移矩阵,并确定第三损失函数;根据所述第二矩阵和所述相似度矩阵反馈调节所述社区矩阵,并确定第四损失函数;根据所述第一损失函数、第二损失函数、第三损失函数和第四损失函数,确定总损失函数;根据所述总损失函数确定所述社区矩阵;并根据所述社区矩阵确定所述社交网络的社区结构。
可选地,所述根据所述总损失函数的局部最优解,确定所述属性矩阵和所述社区矩阵;并根据所述属性矩阵和所述社区矩阵,确定所述社交网络的社区结构,包括:根据所述第三损失函数确定所述属性矩阵的迭代公式;根据预设好的迭代次数以及所述属性矩阵的迭代公式确定所述属性矩阵;根据所述属性矩阵确定所述社交网络的社区结构。
可选地,所述根据所述社交网络的节点属性确定相似度矩阵,包括:获取所述社交网络中的用户信息;对所述用户信息进行分词处理及去噪处理,确定各个所述节点的节点属性;根据所述节点属性,确定属性字典;根据所述节点属性和所述属性字典的相似度,确定所述相似度矩阵。
可选地,所述总损失函数为所述第一损失函数、第二损失函数、第三损失函数和第四损失函数的和。
可选地,所述确定第四损失函数的步骤,包括:将所述第二矩阵和所述相似度矩阵,确定第三矩阵;其中所述第三矩阵为所述第二矩阵和所述相似度矩阵点乘的结果;根据所述第三矩阵和所述社区矩阵,确定所述第四损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110460559.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:WiFi无线网络适配器及其控制方法
- 下一篇:一种短期负荷的预测方法及装置