[发明专利]社交群体挖掘方法、装置、设备及存储介质有效
申请号: | 201810606527.7 | 申请日: | 2018-06-13 |
公开(公告)号: | CN110598122B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 张阳;杨双全 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/9537;G06Q50/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 群体 挖掘 方法 装置 设备 存储 介质 | ||
1.一种社交群体挖掘方法,其特征在于,包括:
获取目标用户的位置信息及网络环境信息,其中,所述网络环境信息,用于表征所述目标用户当前接入的网络地址;
根据所述目标用户的位置信息,确定所述目标用户所属的目标集合;
根据所述目标用户的网络环境信息及所述目标集合中其他各用户的网络环境信息,确定所述目标用户与所述目标集合中其他各用户间的关联度;
根据所述目标用户与所述目标集合中其他各用户间的关联度,确定所述目标用户与所述目标集合中其他各用户的社交关系;所述目标集合对应一个实体名称;
所述确定所述目标用户与所述目标集合中其他各用户的社交关系之后,还包括:
若所述目标用户与所述目标集合中其他各用户存在社交关系,则对所述目标集合对应的实体名称进行解析,确定所述目标集合所属的行业类型;
根据预设的行业类型与标签的映射关系,确定所述目标用户对应的标签集;
所述对所述目标集合对应的实体名称进行解析,确定所述目标集合所属的行业类型,包括:
对所述目标集合对应的实体名称进行解析处理,确定所述目标集合对应的实体名称中各切词单元在所述实体名称中的权值;
根据预设的行业词典,确定所述目标集合对应的实体名称中各切词单元分别对应的各行业概率值;
根据所述各切词单元在所述实体名称中的权值及所述各切词单元分别对应的各行业概率值,确定所述目标集合所属的行业类型。
2.如权利要求1所述的方法,其特征在于,所述确定目标用户所属的目标集合之前,还包括:
对地图数据进行解析,确定各集合与位置的映射关系;
所述确定目标用户所属的目标集合,包括:
根据所述目标用户的位置信息与各集合位置间的距离大小,确定所述目标用户所属的目标集合。
3.如权利要求1所述的方法,其特征在于,所述确定所述目标用户与所述目标集合中其他各用户间的关联度,包括:
基于预设的用户关联模型,确定与所述目标用户的网络环境信息及所述目标集合中其他各用户的网络环境信息,分别对应的各关联度;
其中,所述预设的用户关联模型,为以已知关联度的用户的网络环境信息为样本训练得到。
4.如权利要求1所述的方法,其特征在于,所述目标集合对应N个实体名称,其中N为大于1的正整数;
所述确定所述目标用户与所述目标集合中其他各用户间的关联度之后,还包括:
根据所述目标集合中各用户间的关联度,将所述目标集合进行分簇处理,确定所述目标用户所属的目标簇,其中每个簇对应一个实体名称。
5.如权利要求4所述的方法,其特征在于,所述确定目标用户所属的目标簇,包括:
若所述目标用户与第一簇中各用户间的关联度均大于阈值、与第二簇中各用户间的关联度均小于阈值,则确定所述目标用户所属的目标簇为第一簇。
6.如权利要求4所述的方法,其特征在于,所述确定目标用户所属的目标簇,包括:
若所述目标用户与第一簇中及第二簇中各用户间的关联度均大于阈值、且所述第一簇与所述第二簇分别对应第一实体名称及第二实体名称,则根据所述第一簇中包含的用户数量及第二簇中包含的用户数量,确定目标用户所属的目标簇。
7.如权利要求4所述的方法,其特征在于,
所述确定目标用户所属的目标簇,包括:
若所述目标用户与第一簇及第二簇中各用户间的关联度均大于阈值、且所述第一簇与所述第二簇分别对应第一实体名称及第二实体名称,则根据所述第一实体名称及所述第二实体名称分别所属行业的类型、和/或规模,确定目标用户所属的目标簇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810606527.7/1.html,转载请声明来源钻瓜专利网。