[发明专利]一种基于全连接神经网络实现的移动终端用户性别预测方法和系统在审
申请号: | 202010749181.3 | 申请日: | 2020-07-30 |
公开(公告)号: | CN111898738A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 任永亮;李玲;李嘉懿 | 申请(专利权)人: | 北京智能工场科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00;G06K9/62;G06F40/216 |
代理公司: | 北京君莫知识产权代理事务所(普通合伙) 11715 | 代理人: | 王凝 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 连接 神经网络 实现 移动 终端 用户 性别 预测 方法 系统 | ||
1.一种移动终端用户性别预测方法,所述方法基于全连接神经网络实现,其特征在于,所述方法包括如下步骤:
S1:获取移动终端样本数据;
S2:将所述样本数据进行特征分类,得到连续性特征和离散型特征;
S3:对所述连续性特征和离散型特征分别进行不同的处理后,采用one-shot编码表示,得到one-shot样本特征;
S4:将所有one-hot样本特征进行Embedding映射;
S5:基于Embedding映射后的样本特征构建全连接神经网络模型并进行训练;
S6:采用训练好的全连接神经网络模型,输入移动终端用户特征,预测用户性别。
2.如权利要求1所述的移动终端用户性别预测方法,其特征在于:
所述步骤S1中获取移动终端样本数据,具体包括:
获取移动终端安装包列表、每个安装包对应的应用类别、移动终端品牌、移动终端品牌下的型号、移动终端屏幕尺寸、移动终端操作系统、移动终端系统版本及该移动终端标注的用户的性别和年龄段信息。
3.如权利要求1所述的移动终端用户性别预测方法,其特征在于:
所述步骤S3中对所述连续性特征和离散型特征分别进行不同的处理,具体包括:
对于连续性特征进行分段处理,并进行可视化分析,获取连续数据段以及离散数据段,将所述相邻的离散数据段与所述连续数据段之间的第一空值位段、以及相邻的离散数据段之间的第二空值位段识别出来;
如果所述第一空值位段的数量小于第一阈值,则利用所述离散数据段的众数填充所述第一空值位段;
如果所述第二空值位段的数量大于第二阈值,则删除与所述第二空值位段对应的离散数据段。
4.如权利要求3所述的移动终端用户性别预测方法,其特征在于:
所述步骤S3中对所述连续性特征和离散型特征分别进行不同的处理,具体包括:
将所述分段处理以及可视化分析之后的所述连续性特征进行one-hot表示。
5.如权利要求1或3所述的移动终端用户性别预测方法,其特征在于:
所述连续性特征包括移动终端屏幕尺寸、移动终端系统版本。
6.如权利要求1所述的移动终端用户性别预测方法,其特征在于:
所述离散型特征包括移动终端安装包列表、每个安装包对应的应用类别、移动终端品牌、移动终端品牌下的型号、移动终端操作系统及该移动终端标注的用户的性别和年龄段信息。
7.如权利要求6所述的移动终端用户性别预测方法,其特征在于:
对于所述离散型特征,直接用用one-hot表示。
8.如权利要求1或6所述的移动终端用户性别预测方法,其特征在于:
所述步骤S4将所有one-hot样本特征进行Embedding映射,具体包括:
将移动终端安装包列表转化为TF-IDF(词频-逆文本频率)矩阵来表示,并对该移动终端安装包对应的Embedding进行TF-IDF加权平均。
9.如前述任一项权利要求所述的移动终端用户性别预测方法,其特征在于:
所述全连接神经网络模型任意相邻两层即n-1层任一神经元节点都与n层的所有神经元节点相连,第n层每个神经元节点在进行计算时,其激活函数的输入值是n-1层所有神经节点的加权。
10.一种包含全连接神经网络模型的预测系统,用于实现权利要求1-9任一项所述的移动终端用户性别预测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智能工场科技有限公司,未经北京智能工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010749181.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:九龙山山脉天然矿石窑变釉及其制备方法
- 下一篇:一种燃气管线泄漏溯源方法