[发明专利]分类模型构建方法及装置、电子设备、存储介质在审
申请号: | 202010648024.3 | 申请日: | 2020-07-07 |
公开(公告)号: | CN113971984A | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 钱宝健 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团有限公司 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B20/30;G16B25/10;G16B40/00;G06K9/62 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王姗姗;张颖玲 |
地址: | 215163 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 构建 方法 装置 电子设备 存储 介质 | ||
1.一种分类模型构建方法,其特征在于,所述方法包括:
获取目标对象样本集,并提取所述目标对象样本集的目标特征信息;
确定所述目标特征信息的多个分裂属性;其中,所述分裂属性用于表征所述目标对象样本集中类别分裂节点的属性;
确定所述多个分裂属性分别对应的权重值,并从所述多个分裂属性中获取权重值最大的部分目标分裂属性;所述权重值用于表征分裂属性的类别区分度;
基于所述目标特征信息和所述目标分裂属性,构建所述目标对象的分类模型。
2.根据权利要求1所述的方法,其特征在于,所述分类模型为深度森林模型,其中,所述深度森林模型包括N层级联森林;N为大于1的整数;
所述基于所述目标分裂属性和所述目标特征信息,构建所述目标对象的分类模型,包括:
将所述目标特征信息以及所述目标分裂属性,作为深度森林模型的输入,并对所述深度森林模型中每一层级联森林进行训练和测试,得到训练好的深度森林模型;
将所述训练好的深度森林模型作为所述目标对象的分类模型。
3.根据权利要求2所述的方法,其特征在于,所述将所述目标特征信息和所述目标分裂属性作为深度森林模型的输入,对所述深度森林模型中每一层级联森林进行训练和测试,得到训练好的深度森林模型,包括:
将所述目标特征信息输入至深度森林模型的第一层级联森林,对所述第一层随机森林进行训练和测试,得到第1类别向量;
将第i类别向量和所述目标分裂属性对应的分裂特征向量作为第i+1层级联森林的输入,对所述第i+1层级联森林进行训练和测试,得到第i+1类别向量;其中,所述分裂特征向量用于表征目标特征信息中划分至目标分裂属性的特征向量;
继续将所述第i+1类别向量和所述目标分裂属性对应的分裂特征向量作为第i+2层级联森林的输入,对所述第i+2层随机森林进行训练和测试,直到对第N层级联森林训练和测试完毕为止;其中i为大于等于1且小于N-1的整数。
4.根据权利要求2或3所述的方法,其特征在于,所述将所述目标特征信息和所述目标分裂属性作为深度森林模型的输入之前,还包括:
接收针对所述深度森林模型的配置信息;
基于所述配置信息确定所述深度森林模型中包括的级联森林的最大层数N,每一层级联森林中随机森林的个数M,以及每个随机森林的决策树个数L。
5.根据权利要1-3任一项所述的方法,其特征在于,所述目标对象包括基因表达数据。
6.根据权利要求5所述的方法,其特征在于,所述获取目标对象样本集之前,包括:
获取多个基因表达数据;
对所述多个基因表达数据进行预处理,得到所述目标对象样本集;所述预处理包括:对所述基因表达数据进行空缺值处理和/或标准化处理。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述提取所述目标对象样本集的目标特征信息,包括:
根据预设特征选择方法提取所述目标对象样本集的目标特征信息;其中,所述预设特征选择方法用于降低所述目标对象的维度。
8.根据权利要求7所述的方法,其特征在于,所述预设特征选择方法包括以下至少之一:
T检验方法,费歇Fisher判别法,类别相关特征法,以及遗传算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团有限公司,未经中移(苏州)软件技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010648024.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:膜极距离子膜电解槽
- 下一篇:MWT太阳能电池及生产方法、电池组件及制备方法