[发明专利]性别预测方法、装置、存储介质及电子设备在审

专利信息
申请号: 201711405371.8 申请日: 2017-12-22
公开(公告)号: CN109961163A 公开(公告)日: 2019-07-02
发明(设计)人: 陈岩;刘耀勇 申请(专利权)人: 广东欧珀移动通信有限公司
主分类号: G06Q10/04 分类号: G06Q10/04;G06K9/62
代理公司: 深圳翼盛智成知识产权事务所(普通合伙) 44300 代理人: 黄威
地址: 523860 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 样本 电子设备 多维特征 随机森林 预测 存储介质 目标特征 性别预测 用户使用 决策树 样本集 决策树构建 多个目标 时间采集 信息增益 样本分类 用户性别 申请 男性 女性 输出 分类
【权利要求书】:

1.一种性别预测方法,其特征在于,包括:

获取已知性别用户使用电子设备的多维特征作为样本,得到多个样本;

从所述多维特征中选取相应的目标特征、以及从所述多个样本中选取相应的样本,得到样本集和多个目标特征;

根据所述目标特征对于样本分类的信息增益对所述样本集进行分类,以生成相应的决策树,并返回执行选取目标特征以及样本的步骤直到满足预设决策树生成终止条件为止,其中,所述决策树的输出包括男性或女性;

根据生成的多个所述决策树构建相应的随机森林;

根据预测时间采集未知性别用户使用电子设备的多维特征作为预测样本,并根据所述预测样本以及所述随机森林预测所述未知性别用户的性别。

2.如权利要求1所述的性别预测方法,其特征在于,根据所述预测样本以及所述随机森林预测所述未知性别用户的性别,包括:

根据所述预测样本和所述随机森林中的每棵决策树预测所述未知性别用户的性别,得到多个性别预测结果;

根据所述多个性别预测结果确定所述未知性别用户的性别。

3.如权利要求1所述的性别预测方法,其特征在于,根据所述目标特征对于样本分类的信息增益对所述样本集进行分类,以生成相应的决策树,包括:

生成相应的根节点,并将所述样本集作为所述根节点的节点信息;

将所述根节点的样本集确定为当前待分类的目标样本集;

获取目标样本集内所述目标特征对于样本集分类的信息增益;

根据所述信息增益选取从所述目标特征中选取当前的划分特征;

根据所述划分特征对所述样本集进行划分,得到若干子样本集;

对所述子样本集中样本的所述划分特征进行去除,得到去除后子样本集;

生成当前节点的子节点,并将所述去除后子样本集作为所述子节点的节点信息;

判断子节点是否满足预设分类终止条件;

若否,则将所述目标样本集更新为所述去除后子样本集,并返回执行获取目标样本集内所述目标特征对于样本集分类的信息增益的步骤;

若是,则将所述子节点作为叶子节点,根据所述去除后子样本集中样本的类别设置所述叶子节点的输出,所述样本的类别包括男性、或者女性。

4.如权利要求3所述的性别预测方法,其特征在于,根据所述划分特征对所述样本集进行划分,包括:

获取所述样本集中划分特征的特征值;

根据所述特征值对所述样本集进行划分。

5.如权利要求3所述的性别预测方法,其特征在于,根据所述信息增益选取从所述目标特征中选取当前的划分特征,包括:

从所述信息增益中选取最大的目标信息增益;

判断所述目标信息增益是否大于预设阈值;

若是,则选取所述目标信息增益对应的特征作为当前的划分特征。

6.如权利要求5所述的性别预测方法,其特征在于,所述性别预测方法还包括:

当目标信息增益不大于预设阈值时,将当前节点作为叶子节点,并选取样本数量最多的样本类别作为所述叶子节点的输出。

7.如权利要求3所述的性别预测方法,其特征在于,判断子节点是否满足预设分类终止条件,包括:

判断所述子节点对应的去除后子样本集中样本的类别数量是否为预设数量;

若是,则确定所述子节点满足预设分类终止条件。

8.如权利要求3-7任一项所述的性别预测方法,其特征在于,获取目标样本集内所述目标特征对于样本集分类的信息增益,包括:

获取样本分类的经验熵;

获取所述目标特征对于样本集分类结果的条件熵;

根据所述条件熵和所述经验熵,获取所述目标特征对于所述样本集分类的信息增益。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711405371.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top