[发明专利]特征识别方法、装置、计算机设备和存储介质在审
申请号: | 202010583878.8 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111832631A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 孔清扬 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种特征识别方法,其特征在于,包括以下步骤:
获取多个原始特征,将多个所述原始特征按照预设候选特征生成方法生成多个候选特征;
将每个所述候选特征按照预设第一元特征生成方法生成对应的第一元特征;
将每个所述第一元特征输入至概率模型中,计算每个所述第一元特征为预设标签的概率,作为每个所述候选特征为预设标签的目标概率;其中,所述概率模型基于随机森林模型训练而成;
将每个所述候选特征的目标概率与第一预设阀值进行比较,将所述目标概率大于等于所述第一预设阀值的所有所述候选特征组成候选特征集;
将所述候选特征集中的各个所述候选特征与多个所述原始特征进行结合计算各个所述候选特征的评估值;
将各个所述评估值与第二预设阀值进行比较,若所述评估值大于所述第二预设阀值,则判定所述评估值对应的候选特征为有效特征。
2.根据权利要求1所述的特征识别方法,其特征在于,所述将每个所述第一元特征输入至概率模型中,计算每个所述第一元特征为预设标签的概率,作为每个所述候选特征为预设标签的目标概率的步骤之前,还包括:
获取多个标记训练集,所述标记训练集中包含多个原始训练特征;
根据所述预设候选特征生成方法将多个所述原始训练特征生成多个候选训练特征;
将每个所述标记训练集根据预设第二元特征生成方法生成对应的第二元特征,根据所述预设第一元特征生成方法将多个所述候选训练特征生成对应的所述第三元特征;
为每个所述候选训练特征分配标签;
将多个所述标记训练集所对应的第二元特征与每个所述候选特征所对应的第三元特征组合生成新的训练数据集;将所述新的训练数据集输入至随机森林模型中进行训练,使得所述随机森林模型的输出结果为所述标签的概率,得到训练完成的概率模型。
3.根据权利要求2所述的特征识别方法,其特征在于,所述为每个所述候选特征分配标签的步骤,包括:
将多个所述标记训练集输入至学习器中,计算多个所述标记训练集的第一学习值;
将多个所述标记训练集与每个所述候选训练特征分别组合成数据集;
将每个所述数据集输入至学习器中,计算每个所述数据集各自的第二学习值;
将每个所述数据集各自的第二学习值与所述第一学习值进行对比,若所述数据集的第二学习值大于所述第一学习值,则为所述数据集中加入的所述候选训练特征分配第一类标签。
4.根据权利要求1所述的特征识别方法,其特征在于,所述将所述候选特征集中的各个所述候选特征与多个所述原始特征进行结合计算各个所述候选特征的评估值的步骤,包括:
将多个所述原始特征与所述候选特征集中每个所述候选特征分别组成第一目标特征集;
计算所述第一目标特征集的AUC值,将所述第一目标特征集的AUC值作为所述候选特征的评估值。
5.根据权利要求1所述的特征识别方法,其特征在于,所述将所述候选特征集中的各个所述候选特征与多个所述原始特征进行结合计算各个所述候选特征的评估值的步骤,包括:
将多个所述原始特征与所述候选特征集中每个所述候选特征分别组成第二目标特征集;
计算每个所述第二目标特征集的AUC值和准确度;
根据公式M=ak1+bk2计算所述候选特征的评估值;其中,所述a为所述第二目标特征的AUC值,所述b为所述第二目标特征的准确度,所述k1为所述第二目标特征的AUC值的权重,所述k2为所述第二目标特征的准确度的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010583878.8/1.html,转载请声明来源钻瓜专利网。