[发明专利]类别确定方法及装置在审
申请号: | 201710609544.1 | 申请日: | 2017-07-24 |
公开(公告)号: | CN107437095A | 公开(公告)日: | 2017-12-05 |
发明(设计)人: | 钟子宏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 赵囡囡,褚敏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 类别 确定 方法 装置 | ||
1.一种类别确定方法,其特征在于,包括:
通过分层随机抽样方法对样本集进行抽样,得到抽样样本集;其中,所述样本集中的样本元素包括指定对象的用户账号的特征信息和所述用户账号的类别信息;
将所述抽样样本集作为训练样本集,对用于对待预测用户账号的类别进行预测的预测模型进行训练,得到训练后的预测模型;
将所述待预测用户账号的特征信息输入到所述训练后的预测模型中,得到所述待预测用户账号的类别信息。
2.根据权利要求1所述的方法,其特征在于,在将所述抽样样本集作为训练样本集,对用于对待预测用户账号的类别进行预测的预测模型进行训练,得到训练后的预测模型之后,所述方法还包括:
利用测试样本集对所述训练后的预测模型进行测试;其中,所述测试样本集为所述样本集中除了所述抽样样本集之外的样本元素组成的集合。
3.根据权利要求1或2所述的方法,其特征在于,通过分层随机抽样方法对样本集进行抽样,得到抽样样本集包括:
按照所述用户账号的类别信息将所述样本集进行分层,得到多个子样本集;
对所述多个子样本集中的每一个所述子样本集进行抽样,得到多个子抽样样本集;
将所述多个子抽样样本集合并,得到所述抽样样本集。
4.根据权利要求3所述的方法,其特征在于,对所述多个子样本集中的每一个所述子样本集进行抽样,得到多个子抽样样本集包括:
按照相同的抽样比例对所述多个子样本集中的每一个所述子样本集进行抽样,得到多个所述子抽样样本集。
5.根据权利要求3所述的方法,其特征在于,所述多个子样本集中的抽样概率相等。
6.根据权利要求1所述的方法,其特征在于,所述指定对象包括游戏;所述用户账号的类别信息包括以下至少之一:所述用户账号在预定时间内登录所述游戏,所述用户账号在预定时间内没有登录所述游戏。
7.一种类别确定装置,其特征在于,包括:
抽样模块,用于通过分层随机抽样方法对样本集进行抽样,得到抽样样本集;其中,所述样本集中的样本元素包括指定对象的用户账号的特征信息和所述用户账号的类别信息;
训练模块,用于将所述抽样样本集作为训练样本集,对用于对待预测用户账号的类别进行预测的预测模型进行训练,得到训练后的预测模型;
预测模块,用于将所述待预测用户账号的特征信息输入到所述训练后的预测模型中,得到所述待预测用户账号的类别信息。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
测试模块,用于利用测试样本集对所述训练后的预测模型进行测试;其中,所述测试样本集为所述样本集中除了所述抽样样本集之外的样本元素组成的集合。
9.根据权利要求7或8所述的装置,其特征在于,所述抽样模块包括:
分层单元,用于按照所述用户账号的类别信息将所述样本集进行分层,得到多个子样本集;
抽样单元,用于对所述多个子样本集中的每一个所述子样本集进行抽样,得到多个子抽样样本集;
合并单元,用于将所述多个子抽样样本集合并,得到所述抽样样本集。
10.根据权利要求9所述的装置,其特征在于,所述抽样单元还用于按照相同的抽样比例对所述多个子样本集中的每一个所述子样本集进行抽样,得到多个所述子抽样样本集。
11.根据权利要求7所述的装置,其特征在于,所述指定对象包括游戏;所述用户账号的类别信息包括以下至少之一:所述用户账号在预定时间内登录所述游戏,所述用户账号在预定时间内没有登录所述游戏。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710609544.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种普洱茶酒的配制方法
- 下一篇:一种苦丁茶酒的配制方法