[发明专利]分类模型训练方法、装置、设备及计算机可读存储介质在审
申请号: | 201910826406.8 | 申请日: | 2019-09-03 |
公开(公告)号: | CN110705592A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11321 北京市京大律师事务所 | 代理人: | 刘挽澜 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类模型 样本数据 算法 分类模型训练 连续特征 预设 离散特征 标签 隐含 计算机可读存储介质 人工智能技术 特征提取算法 特征构建 预测结果 自编码 最大化 期望 申请 收敛 保存 检测 预测 转换 优化 | ||
1.一种分类模型训练方法,其特征在于,所述分类模型训练方法包括以下步骤:
获取样本数据,其中,所述样本数据包括带标签样本数据和不带标签样本数据;
基于特征提取算法对所述样本数据进行处理,得到所述样本数据对应的特征,其中,所述样本数据的特征包括离散特征和连续特征,连续特征为数值形式,离散特征为非数值形式;
基于特征转换方法对所述离散特征进行处理,将所述离散特征转换为连续特征;
将所述连续特征和所述离散特征转换得到的连续特征输入至自编码算法中进行降维处理,得到所述样本数据对应的隐含特征;
基于所述带标签样本数据和所述隐含特征构建初始分类模型,并基于所述初始分类模型和预设的期望步骤算法对所述不带标签样本数据进行标签预测;
根据预测结果,结合预设的最大化步骤算法对所述初始分类模型进行优化;
当检测到所述预设的期望步骤算法开始收敛时,确认所述初始分类模型训练完成,并保存训练完成的所述初始分类模型。
2.如权利要求1所述的分类模型训练方法,其特征在于,所述基于特征转换方法对所述离散特征进行处理,将所述离散特征转换为连续特征包括:
若所述离散特征具有次序关系,则对所述离散特征进行量化处理,将所述离散特征转换为连续特征;
若所述离散特征具有非次序关系,且所述离散特征的离散取值个数小于或等于预设个数,则基于one-hot独热编码方法对所述离散特征进行处理,将所述离散特征转换为连续特征;
若所述离散特征具有非次序关系,且所述离散特征的离散取值个数大于预设个数,则对所述离散特征进行衍生处理,将所述离散特征转换为连续特征。
3.如权利要求1所述的分类模型训练方法,其特征在于,所述基于所述带标签样本数据和所述隐含特征构建初始分类模型,并基于所述初始分类模型和预设的期望步骤算法对所述不带标签样本数据进行标签预测包括:
基于所述带标签样本数据和所述隐含特征确定初始分类模型的初始参数πi、μi以及∑i,并基于所述初始参数构建初始分类模型,πi、μi以及∑i的初始值计算公式如下:
其中,∑为协方差矩阵,Xj为样本数据,γij为包含隐含特征的后验概率;
在所述初始分类模型中,通过预设的期望步骤算法对所述不带标签样本数据进行标签预测,所述预设的期望步骤算法的公式如下:
其中,πi为混合系数。
4.如权利要求3所述的分类模型训练方法,其特征在于,所述根据预测结果,结合预设的最大化步骤算法对所述初始分类模型进行优化包括:
获取预设的最大化步骤算法的公式如下:
根据预测结果,基于所述公式对所述初始分类模型的初始参数进行更新。
5.一种分类模型训练装置,其特征在于,所述分类模型训练装置包括:
数据获取模块,用于获取样本数据,其中,所述样本数据包括带标签样本数据和不带标签样本数据;
特征提取模块,用于基于特征提取算法对所述样本数据进行处理,得到所述样本数据对应的特征,其中,所述样本数据的特征包括离散特征和连续特征,连续特征为数值形式,离散特征为非数值形式;
特征转换模块,用于基于特征转换方法对所述离散特征进行处理,将所述离散特征转换为连续特征;
特征降维模块,用于将所述连续特征和所述离散特征转换得到的连续特征输入至自编码算法中进行降维处理,得到所述样本数据对应的隐含特征;
标签预测模块,用于基于所述带标签样本数据和所述隐含特征构建初始分类模型,并基于所述初始分类模型和预设的期望步骤算法对所述不带标签样本数据进行标签预测;
模型优化模块,用于根据预测结果,结合预设的最大化步骤算法对所述初始分类模型进行优化;
模型保存模块,用于当检测到所述预设的期望步骤算法开始收敛时,确认所述初始分类模型训练完成,并保存训练完成的所述初始分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910826406.8/1.html,转载请声明来源钻瓜专利网。