[发明专利]分类模型训练方法、装置、设备及计算机可读存储介质在审
申请号: | 201910826406.8 | 申请日: | 2019-09-03 |
公开(公告)号: | CN110705592A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11321 北京市京大律师事务所 | 代理人: | 刘挽澜 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类模型 样本数据 算法 分类模型训练 连续特征 预设 离散特征 标签 隐含 计算机可读存储介质 人工智能技术 特征提取算法 特征构建 预测结果 自编码 最大化 期望 申请 收敛 保存 检测 预测 转换 优化 | ||
本申请涉及人工智能技术领域,公开了一种分类模型训练方法、装置、设备及计算机可读存储介质。分类模型训练方法包括:获取样本数据;基于特征提取算法得到样本数据对应的特征,其中,样本数据的特征包括离散特征和连续特征;将离散特征转换为连续特征;将连续特征输入至自编码算法中,得到隐含特征;基于带标签样本数据和隐含特征构建初始分类模型,并基于初始分类模型和预设的期望步骤算法对不带标签样本数据进行标签预测;根据预测结果,结合预设的最大化步骤算法对初始分类模型进行优化;当检测到预设的期望步骤算法开始收敛时,确认初始分类模型训练完成,并保存训练完成的初始分类模型。通过本申请,提高了分类模型的泛化能力。
技术领域
本申请涉及人工智能技术领域,尤其涉及分类模型训练方法、装置、设备及计算机可读存储介质。
背景技术
在许多数据分类应用中,如文本分类、图像分类、以及特殊客群的挖掘等,都需要大量的样本来进行分类模型训练,其中,带标签的样本通常难以自动获取,一般都需要人工进行标注,因此,训练样本中带标签的样本数量通常较少,大部分都是不带标签的样本。在分类模型训练的过程中,由于存在大量的不带标签样本,可能会导致模型过拟合或者准确率不高。
发明内容
本申请的主要目的在于提供一种分类模型训练方法、装置、设备及计算机可读存储介质,旨在解决现有的分类模型过拟合或者准确率不高的技术问题。
为实现上述目的,本申请提供一种分类模型训练方法,所述分类模型训练方法包括以下步骤:
获取样本数据,其中,所述样本数据包括带标签样本数据和不带标签样本数据;
基于特征提取算法对所述样本数据进行处理,得到所述样本数据对应的特征,其中,所述样本数据的特征包括离散特征和连续特征,连续特征为数值形式,离散特征为非数值形式;
基于特征转换方法对所述离散特征进行处理,将所述离散特征转换为连续特征;
将所述连续特征和所述离散特征转换得到的连续特征输入至自编码算法中进行降维处理,得到所述样本数据对应的隐含特征;
基于所述带标签样本数据和所述隐含特征构建初始分类模型,并基于所述初始分类模型和预设的期望步骤算法对所述不带标签样本数据进行标签预测;
根据预测结果,结合预设的最大化步骤算法对所述初始分类模型进行优化;
当检测到所述预设的期望步骤算法开始收敛时,确认所述初始分类模型训练完成,并保存训练完成的所述初始分类模型。
可选地,所述基于特征转换方法对所述离散特征进行处理,将所述离散特征转换为连续特征包括:
若所述离散特征具有次序关系,则对所述离散特征进行量化处理,将所述离散特征转换为连续特征;
若所述离散特征具有非次序关系,且所述离散特征的离散取值个数小于或等于预设个数,则基于one-hot独热编码方法对所述离散特征进行处理,将所述离散特征转换为连续特征;
若所述离散特征具有非次序关系,且所述离散特征的离散取值个数大于预设个数,则对所述离散特征进行衍生处理,将所述离散特征转换为连续特征。
可选地,所述基于所述带标签样本数据和所述隐含特征构建初始分类模型,并基于所述初始分类模型和预设的期望步骤算法对所述不带标签样本数据进行标签预测包括:
基于所述带标签样本数据和所述隐含特征确定初始分类模型的初始参数πi、μi以及∑i,并基于所述初始参数构建初始分类模型,πi、μi以及∑i的初始值计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910826406.8/2.html,转载请声明来源钻瓜专利网。