[发明专利]用于确定相似用户的方法、装置和服务器在审
申请号: | 201710451969.4 | 申请日: | 2017-06-15 |
公开(公告)号: | CN107247786A | 公开(公告)日: | 2017-10-13 |
发明(设计)人: | 李泽中 | 申请(专利权)人: | 北京小度信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司11204 | 代理人: | 王达佐,马晓亚 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 相似 用户 方法 装置 服务器 | ||
1.一种用于确定相似用户的方法,其特征在于,所述方法包括:
获取待处理用户集中各用户的用户信息,所述用户信息包括地理位置信息以及与至少一个预设标签关联的历史订单信息;
统计与各所述预设标签关联的历史订单信息对应的用户数量,以确定各所述预设标签的权重;
基于所述待处理用户集中各用户的历史订单信息以及各所述预设标签的权重,生成各所述用户的标签属性特征;
根据所述标签属性特征和地理位置信息将所述待处理用户集中的用户聚类为多个用户簇;
基于所述标签属性特征计算目标用户与同一用户簇中其他用户的相似度并确定出所述目标用户的相似用户。
2.根据权利要求1所述的方法,其特征在于,所述统计与各所述预设标签关联的历史订单信息对应的用户数量,以确定各所述预设标签的权重,包括:
对每个所述预设标签,筛选出与所述预设标签关联的历史订单信息;
统计筛选出的历史订单信息对应的用户数量;
对统计出的用户数量求对数后取倒数作为所述预设标签的权重。
3.根据权利要求1所述的方法,其特征在于,所述基于所述待处理用户集中各用户的历史订单信息以及各所述预设标签的权重,生成各所述用户的标签属性特征,包括:
根据所述历史订单信息,确定每个所述用户对应于各预设标签的下单频次;
基于每个用户对应于各预设标签的下单频次和对应预设标签的权重,计算得出每个用户对应的各所述预设标签的有效下单频次;
基于各所述预设标签的有效下单频次生成所述用户的标签特征向量,作为各所述用户的标签属性特征。
4.根据权利要求3所述的方法,其特征在于,所述基于每个用户对应于各预设标签的下单频次和对应预设标签的权重,计算得出每个用户对应的各所述预设标签的有效下单频次,包括:
将每个用户对应于各预设标签的下单频次与对应各预设标签的权重相乘,作为每个用户对应的各预设标签的有效下单频次;
所述基于各所述预设标签的有效下单频次生成各所述用户的标签特征向量,包括:
将各所述预设标签的有效下单频次作为所述标签特征向量中对应于各所述预设标签的特征值。
5.根据权利要求3所述的方法,其特征在于,所述根据所述标签属性特征和地理位置信息将所述待处理用户集中的用户聚类为多个用户簇,包括:
对各用户的标签特征向量中的元素按特征值进行降序排序,选择排序前预设位的元素对应的预设标签为待匹配标签;
以所述地理位置信息和所述待匹配标签为各所述用户的特征信息,基于所述特征信息将所述待处理用户集中的用户聚类为多个用户簇。
6.根据权利要求5所述的方法,其特征在于,所述以所述地理位置信息和所述待匹配标签为各所述用户的特征信息,基于所述特征信息将所述待处理用户集中的用户聚类为多个用户簇,包括:
将所述地理位置信息相同且至少一个待匹配标签相同的用户聚为同一用户簇。
7.根据权利要求3所述的方法,其特征在于,所述基于所述标签属性特征计算目标用户与同一用户簇中其他用户的相似度并确定出所述目标用户的相似用户,包括:
计算所述目标用户的标签特征向量与同一用户簇中其他各用户的标签特征向量的相似度;
基于所述目标用户的标签特征向量与同一用户簇中其他各用户的标签特征向量的相似度筛选出所述目标用户的相似用户。
8.一种用于确定相似用户的装置,其特征在于,所述装置包括:
获取单元,配置用于获取待处理用户集中各用户的用户信息,所述用户信息包括地理位置信息以及与至少一个预设标签关联的历史订单信息;
统计单元,配置用于统计与各所述预设标签关联的历史订单信息对应的用户数量,以确定各所述预设标签的权重;
生成单元,配置用于基于所述待处理用户集中各用户的历史订单信息以及各所述预设标签的权重,生成各所述用户的标签属性特征;
聚类单元,配置用于根据所述标签属性特征和地理位置信息将所述待处理用户集中的用户聚类为多个用户簇;
确定单元,配置用于基于所述标签属性特征计算目标用户与同一用户簇中其他用户的相似度并确定出所述目标用户的相似用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小度信息科技有限公司,未经北京小度信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710451969.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种静态只读地图文件生成方法和装置
- 下一篇:一种基于多源数据融合的分类方法