[发明专利]一种融合兴趣主题与局部密度的重叠社区检测方法在审
申请号: | 201911215120.2 | 申请日: | 2019-12-02 |
公开(公告)号: | CN111241414A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 李慧;张舒;高超;施珺;戴红伟;樊宁;王霞 | 申请(专利权)人: | 江苏海洋大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 北京和联顺知识产权代理有限公司 11621 | 代理人: | 闫超良 |
地址: | 222005 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 兴趣 主题 局部 密度 重叠 社区 检测 方法 | ||
1.一种融合兴趣主题与局部密度的重叠社区检测方法,其特征在于:包含以下步骤:
S1:通过本体知识库构建用户层次兴趣模型;
S2:根据用户的层次兴趣模型,构造异类超图;
S3:根据异类超图,计算了每个节点的兴趣密度,基于节点的兴趣密度,通过选择社区核心,通过计算局部密度实现重叠社区检测。
2.根据权利要求1所述的一种融合兴趣主题与局部密度的重叠社区检测方法,其特征在于,其中,S1的内容如下:
在现有微博网站上,提取重要的名词实体,计算词频和词频的权重,根据本体知识库,根据TF-IDF机制,用层次兴趣主体及其相应权重对用户进行建模;基于本体的用户建模方法能够有效表示用户的各种偏好,以便通过一个多粒度的相似性模型来识别兴趣社区。
3.根据权利要求2所述的一种融合兴趣主题与局部密度的重叠社区检测方法,其特征在于,其中,S2的内容如下:
1)、对于个性化的本体用户,层次主题用于描述用户的兴趣结构,计算每个主题的用户相似性,根据本体论的概念,能够推断出用户在细粒度主题中可能比粗粒主题中更相似,即,较低层次的主题比上层主题能反映出更多的相似性,因此,选择从主题深度来考虑语义效应,为了区分用户之间的兴趣差异,可将用户之间的主题相似度采用经典的余弦相似度进行计算;
2)、微博中的跟帖行为反映用户的兴趣倾向,相互跟贴的用户可能更熟悉彼此,在微博场景中,可将用户之间的跟随相似度形式化表示为公式;然后,将每一层的主题相似度和跟随相似度结合起来,生成一个顶点和带权值的边构成的异类超图;
3)、根据相邻两个顶点共有的跟随相似度和主题相似度计算用户之间的不熟悉程度,不熟悉程度越低说明用户属于同一社区的可能性会越大;本申请将这种用户之间的不熟悉程度定义为异类度;不同用户之间的加权异类度通过设计公式求解。
4.根据权利要求1所述的一种融合兴趣主题与局部密度的重叠社区检测方法,其特征在于,其中,S3中,关于节点的兴趣密度计算的具体内容如下:
在异类超图中,顶点之间的链接数不均匀,这也反映了用户不同的兴趣链接密度;每个顶点的密度各不相同,表明社会网络中的活跃度也不同;本申请使用的方法是将目标主体分配到局部密度最大的类别中,该方法有一个基本假设,即聚类中心一般都具有一个相对较高的局部链路密度,并且与任何一个局部密度较高的点都有较大的距离,在本申请中使用密度峰值思想来确定超图的核心,并分别定义局部密度、密度异类度和图平均密度的三计算公式;其中,局部密度反映了比阈值更接近的目标主体的数量;密度异类度表示用户和任何其他具有较高密度用户之间的最小异类度;图平均密度反映了整个超图中的平均兴趣链接强度;根据顶点的三种密度,选择几个局部密度峰值节点。
5.根据权利要求4所述的一种融合兴趣主题与局部密度的重叠社区检测方法,其特征在于,其中,S3中,关于重叠社区检测的具体内容如下:
1)、设计社区核心的生成算法,并将这些密度峰值节点初始化为初始社区核心,然后将超图划分为几个密集子图;
2)、根据选定的核心,从相邻顶点找到密度相似的节点,并通过适应度来控制社区的规模,社区是由多个超图中顶点的子集组成;通过公式计算社区子图的适应度,用于度量子图中节点的内部边缘和具有其他节点的外部边缘的贡献;
3)、根据兴趣密度特性,设计相应的兴趣社区检测算法,进行兴趣社区检测;
4)、通过检测超图中顶点的覆盖,可以发现每个节点的自然社区;并设计重叠社区检测算法;通过重叠社区检测算法进行重叠社区的检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏海洋大学,未经江苏海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911215120.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:转向柱组件
- 下一篇:体声波谐振器及其制造方法、滤波器及电子设备