[发明专利]一种基于社区发现的个性化推荐方法有效
申请号: | 202010067688.0 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111274485B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 何泾沙;曹珊;朱娜斐;滕达 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 王维新 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社区 发现 个性化 推荐 方法 | ||
本发明公开了一种基于社区发现的个性化推荐方法,包括:为每个节点赋予唯一的标签,并计算每个节点的度数;根据节点的度数,计算节点权重;计算节点的结构相似性和用户偏好相似性;根据节点的结构相似性和用户偏好相似性,计算节点的相似性;根据节点相似性和节点权重,计算每个标签的传播概率;删除传播概率小于阈值的标签,将剩余的标签作为社区划分的结果;使用链路预测对生成的社区进行社区内的好友推荐。本发明先使用改进的标签传播算法,对所有节点进行社区发现,然后再根据社区发现的结果进行链路预测;其提高社交网络好友推荐的准确性,提高用户的粘性。
技术领域
本发明涉及复杂网络中的数据挖掘技术领域,具体涉及一种基于社区发现的个性化推荐方法。
背景技术
随着信息技术和互联网的发展,人们逐渐进入了信息过载的时代。在社交网络中,由于各种类型的社交媒体用户数量的激增,很难找到他们感兴趣的信息。因此,社交平台上的朋友推荐服务作为信息过滤的重要手段,可以通过社区划分向用户推荐具有相同或相似兴趣的用户,而无需用户的明确要求。高质量的推荐模型将使用户依赖于系统,不仅增加了用户的粘性,而且建立了长期稳定的关系。
复杂网络是复杂系统的抽象,现实中许多复杂系统都可以用复杂网络的相关特性进行描述和分析。网络中的节点表示系统中的个体,边表示个体之间的关系。对复杂网络的研究一直是许多领域的研究热点,其中社区结构是复杂网络中的一个普遍特征,整个网络是由许多个社区组成的。同一个社区内的节点与节点之间的连接很紧密,而社区与社区之间的连接比较稀疏。基于社区发现的个性化推荐方法,可以先对用户进行社区划分,然后在社区内通过对节点的链路预测进行好友推荐。近年来已经开发了几种类型的用于重叠社区检测的算法,包括派系过滤社区划分算法、局部扩展社区划分算法和动态算法。
派系过滤的社区划分算法主要以CPM算法为代表,k-团渗透算法(CPM)是第一个能够发现重叠社区的算法,重叠社区指的是节点可以同时属于多个社区。重叠社区在社交网络中是十分常见的,因为每个人都有着多种多样的社交关系。CPM首先找到网络中所有的k个clique。然后,共享(k-1)个公共节点的每对k-clique,合并为一个社区。派系过滤算法适用于具有密集连接部分的网络。
局部扩展社区划分算法是一种基于节点的重叠社区检测算法,本地扩展的主要思想是选择一个种子社区,然后从中扩展;经典算法有LFM和OSLOM。其中,LFM算法是首先随机选择一个种子节点,然后将其他节点分配给该社区,直到局部优化功能达到局部最大值,在社区不包含的节点中重复此过程。
动态算法是另一种广泛使用的重叠社区检测算法,LPA算法是第一个被提出的标签传播算法,LPA为所有节点指定一个唯一的标签,逐轮刷新所有节点的标签,直到达到收敛为止。LPA算法因为只能给每个节点指定一个标签,所有只能用于非重叠社区的检测。但由于社交网络的复杂性,每个节点都不只属于一个社区,就像每个用户既有朋友圈,又有家庭圈,还有同事圈。所以SLPA算法针对LPA算法进行了改进,每个节点可以拥有多个标签,从而解决了重叠社区检测的问题,同时规定一个迭代停止参数T,来控制SLPA算法的迭代停止。当迭代停止时,对每个节点的历史标签序列中标签出现的频率做统计,按照某一给定的阈值过滤掉那些频率小的标签。该算法虽能有效的发现重叠社区,但由于对全局网络,无论节点大小,都设定统一的阈值,这在真实的网络中是不科学的。因为真实的网络中节点有大有小,应该根据每个节点的权重进行标签筛选。所以本发明针对此问题对标签传播算法进行了改进。
现有的标签传播算法虽然在针对重叠社区的社区检测上取得了一定成效,但没能有效的利用节点间的相似性以及邻居节点权重进行标签的过滤。因为在标签传播过程中,节点更容易接收与自己相似性较高以及权重较大的邻居节点的标签。
发明内容
针对现有技术中存在的缺陷,本发明提供一种基于社区发现的个性化推荐方法。
本发明公开了一种基于社区发现的个性化推荐方法,包括:
为每个节点赋予唯一的标签,并计算每个节点的度数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010067688.0/2.html,转载请声明来源钻瓜专利网。