[发明专利]性别预测方法、装置、存储介质及电子设备在审
申请号: | 201711407282.7 | 申请日: | 2017-12-22 |
公开(公告)号: | CN109961076A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 陈岩;刘耀勇 | 申请(专利权)人: | 广东欧珀移动通信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本集 电子设备 性别预测 存储介质 样本 多维特征 聚类算法 用户使用 用户性别 构建 申请 分类 预测 分析 | ||
1.一种性别预测方法,其特征在于,包括:
获取未知性别用户使用电子设备的多维特征作为样本,并构建性别预测的样本集;
基于聚类算法对样本集内的样本进行分类,得到第一类样本集和第二类样本集;
分别对所述第一类样本集以及所述第二类样本集内的特征进行分析,得到所述第一类样本集、所述第二类样本集对应的性别;
根据所述第一类样本集、所述第二类样本集对应的性别确定未知性别用户的性别。
2.如权利要求1所述的性别预测方法,其特征在于,基于所述聚类算法和所述聚类个数对样本集内的样本进行分类,包括:
从所述样本集内选取两个样本分别作为第一类样本集的第一质心、第二类样本集的第二质心;
获取所述样本集内剩余样本与所述第一质心之间的第一相似度、以及与所述第二质心之间的第二相似度,其中,剩余样本为所述样本集内除质心以外的样本;
根据所述第一相似度以及第二相似度,将所述剩余样本划分到第一类样本集或第二类样本集;
对所述第一质心以及所述第二质心进行更新,并返回执行获取相似度信息的步骤直到满足预设分类终止条件。
3.如权利要求2所述的性别预测方法,其特征在于,根据所述第一相似度以及第二相似度,将所述剩余样本划分到第一类样本集或第二类样本集,包括:
比较所述第一相似度与所述第二相似度;
当所述第一相似度大于所述第二相似度时,将所述剩余样本划分到第一类样本集;
当所述第一相似度小于所述第二相似度时,将所述剩余样本划分到第二类样本集。
4.如权利要求2所述的性别预测方法,其特征在于,对所述第一质心以及所述第二质心进行更新,包括:
根据当前第一类样本集中样本的特征值更新所述第一质心;
根据当前第二类样本集中样本的特征值更新所述第二质心。
5.如权利要求4所述的性别预测方法,其特征在于,根据当前第一类样本集中样本的特征值更新所述第一质心,包括:
获取第一类样本集中样本的特征均值;
根据所述特征均值更新所述第一质心。
6.如权利要求1所述的性别预测方法,其特征在于,获取未知性别用户使用电子设备的多维特征作为样本,包括:
获取未知性别用户使用电子设备的多维特征;
对所述多维特征的特征值进行归一化处理;
将归一化处理后的多维特征作为样本。
7.一种性别预测装置,其特征在于,包括:
样本构建单元,用于获取未知性别用户使用电子设备的多维特征作为样本,并构建性别预测的样本集;
聚类单元,用于基于聚类算法对样本集内的样本进行分类,得到第一类样本集和第二类样本集;
分析单元,用于分别对所述第一类样本集以及所述第二类样本集内的特征进行分析,得到所述第一类样本集、所述第二类样本集对应的性别;
确定单元,用于根据所述第一类样本集、所述第二类样本集对应的性别确定未知性别用户的性别。
8.如权利要求7所述的性别预测装置,其特征在于,所述聚类单元包括:
选择子单元,用于从所述样本集内选取两个样本分别作为第一类样本集的第一质心、第二类样本集的第二质心;
相似度获取子单元,用于获取所述样本集内剩余样本与所述第一质心之间的第一相似度、以及与所述第二质心之间的第二相似度,其中,剩余样本为所述样本集内除质心以外的样本;
分类子单元,用于根据所述第一相似度以及第二相似度,将所述剩余样本划分到第一类样本集或第二类样本集;
更新子单元,用于对所述第一质心以及所述第二质心进行更新,并返回执行获取相似度信息的步骤直到满足预设分类终止条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711407282.7/1.html,转载请声明来源钻瓜专利网。