[发明专利]一种计算用户相似度的方法、系统及装置在审
申请号: | 202011280928.1 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112269937A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 余承乐;彭喜喜 | 申请(专利权)人: | 加和(北京)信息科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 深圳市朝闻专利代理事务所(普通合伙) 44454 | 代理人: | 谭育华 |
地址: | 100026 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 用户 相似 方法 系统 装置 | ||
1.一种计算用户相似度的方法,其特征在于,包括:
获取待测用户数据对;
对所述待测用户数据对进行特征提取,获取所述待测用户数据对中每组待测用户数据的待测用户特征,所述待测用户特征包括待测用户最近一个月媒体APP所关联的网络IP信息、WiFi连接信息、APP使用时间和待测用户的设备信息;
根据所述待测用户特征和预先训练好的相似度分类模型,计算所述待测用户数据对中的两组待测用户数据对应的用户之间的相似度。
2.根据权利要求1所述的方法,其特征在于,在根据所述用户特征和预先训练好的的相似度分类模型,确定所述待测用户数据对中的两组待测用户数据对应的用户之间的相似度之前,所述方法还包括:
获取多个训练用户数据对,所述多个训练用户数据对包括正样本数据对和负样本数据对,所述正样本数据对和负样本数据对的比例为1:1;
所述多个用户数据对中的每个用户数据对进行特征提取,获取每个用户数据对中每组用户数据的用户特征,得到正样本特征和负样本特征;
确定所述正样本特征和负样本特征作为用于训练相似度分类模型的样本数据;
利用所述样本数据对所述相似度分类模型进行训练,得到训练好的相似度分类模型。
3.根据权利要求1所述的方法,其特征在于,所述网络IP信息包括所述待测用户最近一个月工作日内和非工作日的线下轨迹。
4.根据权利要求1所述的方法,其特征在于,所述WiFi连接信息包括所述待测用户最近一个月工作日和非工作日的线下轨迹以及非公共场合的WiFi名称。
5.根据权利要求1所述的方法,其特征在于,所述APP使用时间包括打开时间和关闭时间。
6.根据权利要求1所述的方法,其特征在于,所述设备信息包括手机品牌、型号、操作系统和运营商。
7.根据权利要求1所述的方法,其特征在于,所述相似度分类模型为二分类LightGBM模型。
8.一种计算用户相似度的系统,其特征在于,包括:
第一获取单元,用于获取待测用户数据对;
第二获取单元,用于对待测用户数据对进行特征提取,获取所述待测用户数据对中每组待测用户数据的待测用户特征,所述待测用户特征包括最近一个月待测用户媒体APP所关联的网络IP信息、WiFi连接信息、APP使用时间和用户设备信息;
计算单元,用于根据所述待测用户特征和预先训练好的相似度分类模型,计算所述待测用户数据对中的两组待测用户数据对应的用户之间的相似度。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括:
第三获取单元,用于获取多个训练用户数据对,所述多个训练用户数据对包括正样本数据对和负样本数据对,所述正样本数据对和负样本数据对的比例为1:1;
第四获取单元,用于对所述多个用户数据对中的每个用户数据对进行特征提取,获取每个用户数据对中每组用户数据的用户特征,得到正样本特征和负样本特征,所述用户特征包括最近一个月用户媒体APP所关联的网络IP信息、WiFi连接信息、APP使用时间和用户设备信息;
样本确定单元,用于确定将所述正样本特征和负样本特征作为用于训练相似度分类模型的样本数据;
训练单元,用于利用所述样本数据对所述相似度分类模型进行训练,得到训练好的相似度分类模型。
10.一种计算用户相似度的装置,其特征在于,包括:
处理器、存储器、输入输出单元、总线;
所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
所述处理器具体执行如下操作:
获取待测用户数据对;
对待测用户数据对进行特征提取,获取所述待测用户数据对中每组待测用户数据的待测用户特征,所述用户特征包括最近一个月待测用户媒体APP所关联的网络IP信息、WiFi连接信息、APP使用时间和用户设备信息;
根据所述待测用户特征和预先训练好的相似度分类模型,计算所述待测用户数据对中的两组待测用户数据对应的用户之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于加和(北京)信息科技有限公司,未经加和(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011280928.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于NLP算法的预警处理方法及系统
- 下一篇:一种小体积手机摄像镜头