[发明专利]用户关系挖掘方法及装置、电子设备和存储介质有效
申请号: | 201910815911.2 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110555172B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 宋宇航 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q30/0601 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 关系 挖掘 方法 装置 电子设备 存储 介质 | ||
1.一种用户关系挖掘方法,采用重叠社区发现算法进行所述用户关系分析,其特征在于,包括:
获取用户关系数据,确定所述用户关系数据中的初始用户,对所述初始用户进行异常用户剔除处理,以得到待处理用户,确定所述用户关系数据中所述待处理用户的用户标签;其中,所述待处理用户包括目标用户以及所述目标用户的邻居用户;
获取最大分组数量;
确定所述待处理用户的初始用户分组与初始系数;将所述待处理用户的所述初始用户分组与所述初始系数进行组合处理以形成所述初始标签;其中,所述初始标签包括目标用户的初始用户标签以及所述邻居用户的初始邻居标签;
根据所述最大分组数量与所述初始邻居标签更新所述初始用户标签,直至标签更新操作满足更新停止条件,确定所述结果标签;
根据所述结果标签确定所述目标用户的用户分组。
2.根据权利要求1所述的用户关系挖掘方法,其特征在于,所述获取用户关系数据,包括:
获取采集数据,对所述采集数据进行加密处理得到加密用户数据;
从所述加密用户数据中确定所述待处理用户的关联信息元组;
统计所述关联信息元组的关联数量作为所述关联信息元组的权重;
将包含所述权重的所述关联信息元组作为所述用户关系数据。
3.根据权利要求1所述的用户关系挖掘方法,其特征在于,所述根据所述最大分组数量与所述初始邻居标签更新所述初始用户标签,直至标签更新操作满足更新停止条件,确定所述结果标签,包括:
将根据所述初始邻居标签计算得到所述目标用户的用户标签作为当前用户标签;
如果所述当前用户标签满足更新停止条件,则将所述当前用户标签作为所述结果标签;其中,所述结果标签中的用户分组数量小于最大分组数量。
4.根据权利要求3所述的用户关系挖掘方法,其特征在于,所述目标用户的数量为多个,所述更新停止条件包括以下任意一个或多个的组合:
各所述目标用户的用户分组的数量小于等于最大分组数量;
各所述目标用户对应的分组数量与上次更新计算得到的分组数量相同;
所述标签更新操作的次数大于预设最大更新次数。
5.一种用户关系挖掘方法,基于二跳邻居算法,其特征在于,包括:
获取用户关系数据,确定所述用户关系数据中的用户;其中,所述用户包括目标用户以及所述目标用户的关联用户;
从所述用户关系数据中确定所述用户的初始用户标签;所述初始用户标签包括所述目标用户的初始目标用户标签以及所述关联用户的初始关联用户标签;
将所述初始目标用户标签更新至所述初始关联用户标签得到中间关联用户标签;将所述初始关联用户标签更新至所述初始目标用户标签得到中间目标用户标签;根据所述中间关联用户标签再次进行标签更新操作后,删除所述中间关联用户标签,得到结果关联用户标签;根据所述中间目标用户标签再次进行标签更新操作后,删除所述中间目标用户标签,得到结果目标用户标签;将所述结果关联用户标签与所述结果目标用户标签作为所述结果用户标签;
确定与所述目标用户具有所述共同邻居用户的用户作为初始关联用户;确定所述目标用户与所述初始关联用户的共同邻居数量;按照共同邻居数量对所述结果用户标签进行预排序处理得到预排序结果;对所述预排序结果进行异常性补偿排序处理以得到输出结果集;将根据所述输出结果集确定出的关联用户作为所述结果关联用户;其中,所述结果关联用户与所述目标用户具有共同邻居用户且关联系数达到预设阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910815911.2/1.html,转载请声明来源钻瓜专利网。