[发明专利]一种用户年龄性别的预测方法及装置有效
申请号: | 201910120476.1 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109885834B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 高洁;关键;张涛 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/30;G06F40/279;G06N99/00;G06Q10/04 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 年龄 性别 预测 方法 装置 | ||
1.一种用户年龄性别的预测方法,其特征在于,
获取第一集合和第二集合,其中,所述第一集合包括多个用户的第一终端信息、第一应用程序APP信息和对应的用户年龄性别信息,所述第二集合包括多个用户的第二终端信息和第二APP信息,第一APP信息和第二APP信息包括APP使用信息,所述APP使用信息用于指示用户使用对应APP的时间;
对所述第一集合进行特征提取得到第一特征集合,对所述第二集合进行特征提取得到第二特征集合,其中,所述第一特征集合包括所述第一终端信息的特征和所述第一APP信息的特征,所述第二特征集合包括所述第二终端信息的特征和所述第二APP信息的特征;
根据所述第一特征集合和所述对应的用户年龄性别信息对机器学习算法进行训练,以确定所述机器学习算法的参数并得到第三特征集合,其中,所述第三特征集合为所述第一特征集合中对应的损失函数值小于第一预设值的特征的集合;
将第四特征集合代入采用所述参数的机器学习算法,得到目标用户年龄性别信息,其中,所述第四特征集合为所述第二特征集合中与所述第三特征集合相同的特征的集合。
2.根据权利要求1所述的用户年龄性别的预测方法,其特征在于,所述对所述第一集合进行特征提取得到第一特征集合,对所述第二集合进行特征提取得到第二特征集合,包括:
根据APP安装列表信息得到APP词汇的权重值;
确定权重值高于第二预设值的APP词汇作为APP关键词汇;
根据所述第一集合中与所述APP关键词汇对应的所述APP使用信息,得到与所述第一集合对应的所述APP关键词汇的各时段使用频次和所述APP关键词汇的各时段使用量;并确定所述第一特征集合包括与所述第一集合对应的所述APP关键词汇的各时段使用频次和所述APP关键词汇的各时段使用量;
根据所述第二集合中与所述APP关键词汇对应的所述APP使用信息,得到与所述第二集合对应的所述APP关键词汇的各时段使用频次和所述APP关键词汇的各时段使用量;并确定所述第二特征集合包括与所述第二集合对应的所述APP关键词汇的各时段使用频次和所述APP关键词汇的各时段使用量。
3.根据权利要求1所述的用户年龄性别的预测方法,其特征在于,所述第三特征集合初始为空,所述根据所述第一特征集合和所述对应的用户年龄性别信息对机器学习算法进行训练,以确定所述机器学习算法的参数并得到第三特征集合包括以下步骤:
步骤a、将第一特征、第三特征集合和所述对应的用户年龄性别信息代入所述机器学习算法中训练,并调整所述机器学习算法的参数,得到所述机器学习算法的第一参数,其中,所述第一特征为训练集合中的一个特征,所述训练集合为所述第一特征集合中预设数量的特征的集合;
步骤b、将第二特征代入采用第一参数的机器学习算法,得到第一年龄性别信息,根据所述第一年龄性别信息计算损失函数的值,若所述损失函数的值小于所述第一预设值,则确定所述第三特征集合包括所述第一特征,其中,所述第二特征为验证集合中与第一特征、第三特征集合相同的特征,所述验证集合为所述第一特征集合中除所述训练集合以外的特征的集合;
重复执行步骤a至步骤b,直至所述训练集合的特征全部代入所述机器学习算法,得到所述第三特征集合和所述机器学习算法的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910120476.1/1.html,转载请声明来源钻瓜专利网。