[发明专利]用户社会属性的确定方法、装置与电子设备有效
申请号: | 201811296676.4 | 申请日: | 2018-11-01 |
公开(公告)号: | CN111127064B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 杨旭虹 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06Q50/00 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 罗英;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 社会 属性 确定 方法 装置 电子设备 | ||
本申请实施例公开了一种用户社会属性的确定方法、装置与电子设备,所述方法包括:获取N个用户在预设时间内的IP数据;根据所述N个用户在预设时间内的IP数据,对所述N个用户进行群体划分,获得M个群体,其中,一个群体对应的IP数据相同,所述M为小于N的正整数;根据每个群体对应的IP数据,确定每个群体对应的工作单位;根据每个群体对应的工作单位,确定每个群体中每个用户的社会属性。本实施例以工作单位为桥梁,可以获取一个用户更多维的社会属性,其准确率高。同时,本申请实施例一次可以获得多个用户的社会属性,进而提高了用户社会属性确定的效率。
技术领域
本申请实施例涉及互联网技术领域,尤其涉及一种用户社会属性的确定方法、装置与电子设备。
背景技术
用户的职业、行业、工作地、收入等社会属性是用户个人信息的重要组成部分,这类属性是精准营销与个性化服务的基石。各业务方对这类属性有强烈需求,例如,百度Feed希望获取用户所属行业信息,以向用户推送行业相关资讯。再例如,百度招聘需要拉新用户,并对新用户给出匹配度最高的职位。
现有技术在确定用户的社会属性时,收集社会属性中每个标签的样本集,例如收集用户的职业、行业、工作地、收入等每个标签的样本集。接着,对每个标签的样本集进行特征选择,构建每个标签的模型,并进行训练。
但是,每个标签的样本集有效,其对应的重要特征稀疏,进而基于稀疏的重要特征构建的模型,无法准确预测出用户的社会属性。
发明内容
本申请实施例提供一种用户社会属性的确定方法、装置与电子设备,以实现对用户社会属性的准确、快速确定。
第一方面,本申请实施例提供一种用户社会属性的确定方法,包括:
获取N个用户在预设时间内的IP数据,其中,所述N为大于等于1的正整数;
根据所述N个用户在预设时间内的IP数据,对所述N个用户进行群体划分,获得M个群体,其中,一个群体对应的IP数据相同,所述M为小于N的正整数;
根据每个群体对应的IP数据,确定每个群体对应的工作单位;
根据每个群体对应的工作单位,确定每个群体中每个用户的社会属性。
在第一方面的一种可能的实现方式中,所述根据所述N个用户在预设时间内的IP数据,对所述N个用户进行群体划分,获得M个群体,包括:
根据N个用户在预设时间内的IP数据,确定N个用户之间的关系图;
基于社区发现算法和所述N个用户之间的关系图,确定M个群体。
在第一方面的另一种可能的实现方式中,所述根据N个用户在预设时间内的IP数据,确定N个用户之间的关系图,包括:
以所述N个用户在每个用户为节点,两个节点之间的边的权重表示在预设时间内在同一个IP地址出现的次数,确定出所述N个用户之间的关系图。
在第一方面的另一种可能的实现方式中,所述基于社区发现算法和所述N个用户之间的关系图,确定M个群体,包括:
切断边的权重小于预设值的边,确定出M个群体。
在第一方面的另一种可能的实现方式中,所述根据每个群体对应的工作单位,确定每个群体中每个用户的社会属性,包括:
根据每个群体对应的工作单位和所述用户的行为信息,确定每个群体中每个用户的社会属性。
可选的,所述用户的社会属性包括以下的一个或多个:行业、职业、收入水平、学历和工作地点。
在第一方面的另一种可能的实现方式中,所述获取N个用户在预设时间内的IP数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811296676.4/2.html,转载请声明来源钻瓜专利网。