[发明专利]性别预测方法、装置、存储介质及电子设备在审
申请号: | 201711407326.6 | 申请日: | 2017-12-22 |
公开(公告)号: | CN109961077A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 陈岩;刘耀勇 | 申请(专利权)人: | 广东欧珀移动通信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子设备 分类回归树 性别预测 样本集 样本 预测 存储介质 多维特征 用户使用 构建 模型预测 时间采集 用户性别 指数信息 分类 基尼 申请 男性 女性 输出 | ||
1.一种性别预测方法,其特征在于,包括:
获取已知性别用户使用电子设备的多维特征作为样本,并构建性别预测的样本集;
根据所述特征对于样本集分类的基尼指数信息增益对所述样本集进行分类,以构建出相应的分类回归树模型,所述分类回归树模型的输出包括男性、或者女性;
根据预测时间采集未知性别用户使用电子设备的多维特征作为预测样本;
根据所述预测样本和所述分类回归树模型预测所述未知性别用户的性别。
2.如权利要求1所述的性别预测方法,其特征在于,根据所述特征对于样本集的基尼指数信息增益对所述样本集进行划分,以构建出相应的分类回归树模型,包括:
生成分类回归树模型的根节点,并将所述样本集分配给所述根节点;
将所述根节点的样本集确定为当前待分类的目标样本集;
获取所述特征对于目标样本集分类的基尼指数信息增益;
根据所述基尼指数信息增益从所述特征中选取当前的划分特征及其对应的划分点;
根据所述划分特征和所述划分点对所述样本集进行划分,得到两个子样本集;
生成当前节点的子节点,并将所述去所述子样本集分配给相应的所述子节点;
判断所述子节点是否满足预设分类终止条件;
若否,则将所述目标样本集更新为所述子样本集,并返回执行获取所述特征对于目标样本集的基尼指数的步骤;
若是,则将所述子节点作为叶子节点,根据所述子样本集中样本的样本类别设置所述叶子节点的输出,所述样本类别包括男性、或者女性。
3.如权利要求2所述的性别预测方法,其特征在于,获取所述特征对于目标样本集分类的基尼指数信息增益,包括:
获取所述特征的取值对于目标样本集分类的基尼指数;
根据所述基尼指数,获取所述特征的取值对于目标样本集分类的基尼指数信息增益。
4.如权利要求3所述的性别预测方法,其特征在于,获取所述特征的取值对于目标样本集分类的基尼指数信息增益,包括:
根据所述特征的取值将所述目标样本集划分成第一子样本集和第二子样本集;
获取所述第一子样本集和所述第二子样本集中样本类别的概率;
根据所述样本类别的概率获取所述取值对于目标样本分类的基尼指数。
5.如权利要求3所述的性别预测方法,其特征在于,根据所述样本类别的概率获取所述取值对于目标样本分类的基尼指数,包括:
根据所述第一子样本集中样本类别的概率获取所述特征为取值时对于目标样本集分类的第一基尼指数;
根据所述第二子样本集中样本类别的概率获取所述特征不为取值时对于目标样本集分类的第二基尼指数;
根据所述基尼指数,获取所述特征对于目标样本集分类的基尼指数信息增益,包括:
根据所述第一基尼指数、第一子样本集与目标样本集的样本数量比值、第二基尼指数、以及第二子样本集与目标样本集的样本数量比值,获取所述特征的取值对于目标样本集分类的基尼指数信息增益。
6.如权利要求5所述的性别预测方法,其特征在于,根据所述基尼指数,获取所述特征对于目标样本集分类的基尼指数信息增益,包括:
通过如下公式计算出特征对于目标样本集分类的基尼指数信息增益:
其中,Gini(D,A)为特征A对于目标样本集D分类的基尼指数信息增益,Gini(D1)为特征A为取值a时对于目标样本D分类的基尼指数,Gini(D2)为A不为取值a时对于目标样本D分类的基尼指数;a为特征A的一种取值,D1和D2为基于特征A=a对目标样本集D划分后得到的两个子样本集。
7.如权利要求2所述的性别预测方法,其特征在于,根据所述基尼指数信息增益从所述特征中选取当前的划分特征及其对应的划分点,包括:
从所述基尼指数信息增益中确定最小的目标基尼指数信息增益;
将所述目标基尼指数信息增益的特征及其取值,分别作为划分特征和划分点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711407326.6/1.html,转载请声明来源钻瓜专利网。