[发明专利]性别预测方法、装置、存储介质及电子设备在审
申请号: | 201711405371.8 | 申请日: | 2017-12-22 |
公开(公告)号: | CN109961163A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 陈岩;刘耀勇 | 申请(专利权)人: | 广东欧珀移动通信有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 电子设备 多维特征 随机森林 预测 存储介质 目标特征 性别预测 用户使用 决策树 样本集 决策树构建 多个目标 时间采集 信息增益 样本分类 用户性别 申请 男性 女性 输出 分类 | ||
1.一种性别预测方法,其特征在于,包括:
获取已知性别用户使用电子设备的多维特征作为样本,得到多个样本;
从所述多维特征中选取相应的目标特征、以及从所述多个样本中选取相应的样本,得到样本集和多个目标特征;
根据所述目标特征对于样本分类的信息增益对所述样本集进行分类,以生成相应的决策树,并返回执行选取目标特征以及样本的步骤直到满足预设决策树生成终止条件为止,其中,所述决策树的输出包括男性或女性;
根据生成的多个所述决策树构建相应的随机森林;
根据预测时间采集未知性别用户使用电子设备的多维特征作为预测样本,并根据所述预测样本以及所述随机森林预测所述未知性别用户的性别。
2.如权利要求1所述的性别预测方法,其特征在于,根据所述预测样本以及所述随机森林预测所述未知性别用户的性别,包括:
根据所述预测样本和所述随机森林中的每棵决策树预测所述未知性别用户的性别,得到多个性别预测结果;
根据所述多个性别预测结果确定所述未知性别用户的性别。
3.如权利要求1所述的性别预测方法,其特征在于,根据所述目标特征对于样本分类的信息增益对所述样本集进行分类,以生成相应的决策树,包括:
生成相应的根节点,并将所述样本集作为所述根节点的节点信息;
将所述根节点的样本集确定为当前待分类的目标样本集;
获取目标样本集内所述目标特征对于样本集分类的信息增益;
根据所述信息增益选取从所述目标特征中选取当前的划分特征;
根据所述划分特征对所述样本集进行划分,得到若干子样本集;
对所述子样本集中样本的所述划分特征进行去除,得到去除后子样本集;
生成当前节点的子节点,并将所述去除后子样本集作为所述子节点的节点信息;
判断子节点是否满足预设分类终止条件;
若否,则将所述目标样本集更新为所述去除后子样本集,并返回执行获取目标样本集内所述目标特征对于样本集分类的信息增益的步骤;
若是,则将所述子节点作为叶子节点,根据所述去除后子样本集中样本的类别设置所述叶子节点的输出,所述样本的类别包括男性、或者女性。
4.如权利要求3所述的性别预测方法,其特征在于,根据所述划分特征对所述样本集进行划分,包括:
获取所述样本集中划分特征的特征值;
根据所述特征值对所述样本集进行划分。
5.如权利要求3所述的性别预测方法,其特征在于,根据所述信息增益选取从所述目标特征中选取当前的划分特征,包括:
从所述信息增益中选取最大的目标信息增益;
判断所述目标信息增益是否大于预设阈值;
若是,则选取所述目标信息增益对应的特征作为当前的划分特征。
6.如权利要求5所述的性别预测方法,其特征在于,所述性别预测方法还包括:
当目标信息增益不大于预设阈值时,将当前节点作为叶子节点,并选取样本数量最多的样本类别作为所述叶子节点的输出。
7.如权利要求3所述的性别预测方法,其特征在于,判断子节点是否满足预设分类终止条件,包括:
判断所述子节点对应的去除后子样本集中样本的类别数量是否为预设数量;
若是,则确定所述子节点满足预设分类终止条件。
8.如权利要求3-7任一项所述的性别预测方法,其特征在于,获取目标样本集内所述目标特征对于样本集分类的信息增益,包括:
获取样本分类的经验熵;
获取所述目标特征对于样本集分类结果的条件熵;
根据所述条件熵和所述经验熵,获取所述目标特征对于所述样本集分类的信息增益。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711405371.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:路径规划方法和路径规划装置
- 下一篇:件量预测方法、装置、设备及其存储介质
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理