[发明专利]对象分类方法、装置、可读介质及电子设备在审
申请号: | 202111671141.2 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114330578A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 钱炜烁;石崇文;潘煜文;苏博览;黄博 | 申请(专利权)人: | 北京字跳网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/764;G06V10/774 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 张岩龙 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 分类 方法 装置 可读 介质 电子设备 | ||
1.一种对象分类方法,其特征在于,所述方法包括:
获取待分类对象的多个第一对象特征;
将所述多个第一对象特征输入目标分类模型,得到所述待分类对象对应的目标类别;
其中,所述目标分类模型为通过第二对象特征对预设规则分类模型进行训练得到的分类模型,所述第二对象特征是对所述多个第一对象特征进行特征简化处理后得到的特征。
2.根据权利要求1所述的方法,其特征在于,所述目标分类模型是通过以下方式训练得到的:
获取多个样本对象,每个所述样本对象包括多个第一对象特征;
对所述多个第一对象特征进行特征简化处理,确定第二对象特征;
根据所述多个样本对象和所述第二对象特征,对所述预设规则分类模型进行训练,得到所述目标分类模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述多个第一对象特征进行特征简化处理,确定第二对象特征包括:
获取每个第一对象特征的特征价值;
将所述特征价值在预设价值范围内的第一对象特征作为所述第一候选特征;
根据所述第一候选特征,获取所述第二对象特征。
4.根据权利要求3所述的方法,其特征在于,所述特征价值包括特征独特度和/或信息价值,所述特征独特度为根据所述样本对象的数量和所述第一对象特征的非重复值数量计算得到的,所述信息价值用于表征所述第一对象特征与对象分类结果的相关度。
5.根据权利要求2所述的方法,其特征在于,所述第一对象特征包括连续特征,所述连续特征用于表征特征值为连续数值的特征,所述对所述多个第一对象特征进行特征简化处理,确定第二对象特征包括:
将所述连续特征按照预设分类尺度进行对数舍入后,得到第三候选特征;
根据所述第三候选特征,获取所述第二对象特征。
6.根据权利要求5所述的方法,其特征在于,所述样本对象还包括分类标签;所述根据所述第三候选特征,获取所述第二对象特征包括:
根据所述分类标签和预设分箱数目,对所述第三候选特征进行卡方分箱处理,得到第四候选特征;
将所述第四候选特征作为所述第二对象特征。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取所述卡方分箱处理后的第四候选特征的分箱配置参数;所述分箱配置参数包括第四候选特征的取值与第一对象特征的取值的对应关系;
所述根据所述多个样本对象和所述第二对象特征,对所述预设规则分类模型进行训练,得到所述目标分类模型包括:
根据所述多个样本对象和所述第二对象特征,对所述预设规则分类模型进行训练,得到待定分类模型;
根据所述分箱配置参数更新所述待定分类模型中的分类规则,得到目标分类模型。
8.一种对象分类装置,其特征在于,所述装置包括:
特征获取模块,用于获取待分类对象的多个第一对象特征;
对象分类模块,用于将所述多个第一对象特征输入目标分类模型,得到所述待分类对象对应的目标类别;
其中,所述目标分类模型为通过第二对象特征对预设规则分类模型进行训练得到的分类模型,所述第二对象特征是对所述多个第一对象特征进行特征简化处理后得到的特征。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1至7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现权利要求1至7中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字跳网络技术有限公司,未经北京字跳网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111671141.2/1.html,转载请声明来源钻瓜专利网。