[发明专利]融合标签平均划分距离和结构关系的社区可重叠划分方法有效
申请号: | 201711187974.5 | 申请日: | 2017-11-24 |
公开(公告)号: | CN108090132B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 马慧芳;陈海波;赵卫中;邴睿;黄乐乐 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 兰州中科华西专利代理有限公司 62002 | 代理人: | 李艳华 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明涉及一种融合标签平均划分距离和结构关系的社区可重叠划分方法,该方法包括以下步骤:⑴微博数据抓取;⑵核心标签划分:①对标签进行扩充;②定义标签区分度TD |
||
搜索关键词: | 融合 标签 平均 划分 距离 结构 关系 社区 重叠 方法 | ||
【主权项】:
1.融合标签平均划分距离和结构关系的社区可重叠划分方法,包括以下步骤:⑴微博数据抓取;⑵核心标签划分:①对标签进行扩充;②定义标签区分度TDi ,并获取TDi 较大的top-l个标签作为核心标签并用作后续步骤的社区划分;⑶基于平均划分距离的准社区划分:ⅰ定义并计算划分熵:给定核心标签t i ∈Tcore ,Tcore 代表核心标签集合;设t i 构成的划分为 ,式中 代表用户集合且V={v1 ,v2 …vn },n为用户数目,vi 表示某一用户节点且vi ∈V, 代表包含标签t i 的用户集合, 代表不包含标签t i 的用户集合;P(Ci )表示取到包含标签t i 的用户集合这一事件的发生概率,则核心标签ti 的划分熵 定义为: ;ⅱ定义并计算划分条件熵:给定核心标签t i ,t j ∈Tcore ,设t i ,t j 构成的划分分别为 和 ,式中 代表用户集合, 代表包含标签t i 的用户集合, 代表不包含标签t i 的用户集合, 代表包含标签t j 的用户集合, 代表不包含标签t j 的用户集合;则核心标签t j 关于核心标签t i 的划分条件熵 定义为: ;ⅲ定义并计算划分联合熵:给定核心标签t i ,t
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711187974.5/,转载请声明来源钻瓜专利网。