[发明专利]用户性别预测方法、装置及设备在审
申请号: | 201710507593.4 | 申请日: | 2017-06-28 |
公开(公告)号: | CN109145932A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 许雪敏 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 江婷;李发兵 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 性别预测 预测 预设 特征数据 用户性别 用户预测 预测结果 装置及设备 输出结果 准确率 融合 | ||
1.一种用户性别预测方法,所述方法包括:
提取各待预测用户的各预设类型数据之用于进行性别预测的特征数据;
将提取的特征数据代入预设的全量用户预测模型得到所述各待预测用户的全量性别预测结果,并将至少一个预设类型数据的各特征数据分别代入该预设类型数据之各特征数据分别对应的预设分量用户预测模型得到至少一个所述待预测用户的分量性别预测结果;所述全量用户预测模型为在训练过程中根据训练用户的所述各预设类型数据之特征数据训练得到,所述分量用户预测模型为在训练过程中根据所述训练用户的所述至少一个预设类型数据之各特征数据训练得到;
融合所述全量预测结果和所述分量预测结果得到所述各待预测用户的最终性别预测结果。
2.如权利要求1所述的用户性别预测方法,其特征在于,所述预设类型数据包括所述训练过程中预设网页的上网记录数据;
所述上网记录数据之特征数据包括至少一个针对男性性别预测的特征数据和至少一个针对女性性别进行预测的特征数据的至少一种;
所述每一针对男性性别预设的特征数据包括预设目标网站以及各预设目标网站的访问量;所述各预设目标网站为在训练过程中,访问预设目标网站男性占比值大于等于所述训练用户中男性占比值,一个特征数据中的目标网站包含访问网站男性占比值在预设男性比例值划分范围内的各网站;
所述每一针对女性性别预设的特征数据包括预设目标网站以及各预设目标网站的访问量;所述各预设目标网站为在训练过程中,访问预设目标网站女性占比值大于等于所述训练用户中女性占比值;
所述将至少一个预设类型数据的各特征数据分别代入该预设类型数据之各特征数据分别对应的预设分量用户预测模型包括:
将所述上网记录数据包括的各特征数据分别代入该上网记录数据之各特征数据各自对应的预设分量用户预测模型。
3.如权利要求1所述的用户性别预测方法,其特征在于,所述预设类型数据包括所述训练过程中预设应用的应用使用记录数据;
所述应用使用记录数据之特征数据包括至少一个针对男性性别预测的特征数据和至少一个针对女性性别进行预测的特征数据;
所述每一针对男性性别预设的特征数据包括预设目标应用以及各预设目标应用的访问量;所述各预设目标应用为在训练过程中,使用预设目标应用的男性占比值大于等于所述训练用户中男性占比值,一个特征数据中的目标应用包含使用应用的男性占比值在预设男性比例值划分范围内的各应用;
所述每一针对女性性别预设的特征数据包括预设目标应用以及各预设目标应用的访问量;所述各预设目标应用为在训练过程中,使用预设目标应用的女性占比值大于等于所述训练用户中女性占比值;
所述将至少一个预设类型数据的各特征数据分别代入该预设类型数据之各特征数据分别对应的预设分量用户预测模型包括:
将所述应用使用记录数据包括的各特征数据分别代入该应用使用记录数据之各特征数据各自对应的预设分量用户预测模型。
4.如权利要求2或3所述的用户性别预测方法,其特征在于,所述预设类型数据还包括通话数据和上网使用习惯数据中的至少一种;
所述通话数据之特征数据包括联系人个数,被叫总时长,主叫总时长,被叫次数,主叫次数,通话总次数,被叫次数与通话总次数之商以及主叫次数与通话总次数之商中的至少一种;
所述上网使用习惯数据之特征数据包括每个预设上网统计周期的上网概率,以及每个上网信息统计周期内上网的信息熵中的至少一种。
5.如权利要求1所述的用户性别预测方法,其特征在于,所述全量预测结果和所述分量预测结果为各待预测用户的性别概率值;
所述融合所述全量预测结果和所述分量预测结果得到所述各待预测用户的最终性别预测结果包括:
针对每一待预测用户,获取该待预测用户的全量用户预测模型输出的性别概率值和各分量用户预测模型输出的性别概率值;
计算获取到的所述性别概率值的均值得到性别预测概率值;
将所述性别预测概率值与所述训练过程中设置的男性概率阈值和女性概率阈值进行比较,得到该待预测用户最终的性别预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710507593.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:物体检测方法、装置及存储介质
- 下一篇:媒体资源的分类器训练方法及装置