[发明专利]分类模型的训练方法、装置、电子设备及存储介质有效
申请号: | 201910113211.9 | 申请日: | 2019-02-13 |
公开(公告)号: | CN109858558B | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 张志伟;吴丽军;李焱 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;丁芸 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 装置 电子设备 存储 介质 | ||
本公开是关于一种分类模型的训练方法、装置、电子设备及存储介质。该训练方法中,预先将各个样本数据的分类标签,按照语义划分为具有上下位关系的至少两个层级;确定待训练的分类模型所需训练阶段的目标数量;在每一训练阶段,确定该训练阶段对应的目标层级,利用样本数据集中,目标层级的分类标签对应的样本数据,对分类模型进行训练,在满足预定收敛条件时,结束该训练阶段的训练过程;其中,目标数量个训练阶段中,至少有两个训练阶段所对应的目标层级不相同;在最后一个训练阶段结束后,完成对分类模型的训练。本公开提供的分类模型的训练方法,可以在将样本数据的分类标签之间的上下位关系考虑在内的前提下,实现对分类模型的有效训练。
技术领域
本公开涉及分类模型技术领域,尤其涉及一种分类模型的训练方法、装置、电子设备及存储介质。
背景技术
相关技术中,分类模型的训练方式是,从样本数据集中随机选取样本数据输入至模型中,进而,利用所选取的样本数据对模型加以训练,得到训练完毕的分类模型。
尽管上述的分类模型的训练方式可以实现模型的训练,但是,发明人在实现本发明的过程中,发现相关技术至少存在如下问题:
样本数据集中,有些样本数据的分类标签为上位形式的分类标签,有些样本数据的分类标签为下位形式的分类标签,例如,在训练图片分类模型时,有的样本图片的分类标签是狗,而有的样本图片的分类标签则是狗的品种,例如哈士奇等。然而,相关技术在训练分类模型时,并未将这种情况考虑在内,这无疑影响模型的准确度。因此,在将样本数据的分类标签之间的上下位关系考虑在内的前提下,如何实现对分类模型的有效训练,从而得到准确度较高的分类模型,是一个亟待解决的技术问题。
发明内容
为克服相关技术中存在的问题,本公开提供一种分类模型的训练方法、装置、电子设备及存储介质。
根据本公开实施例的第一方面,提供一种分类模型的训练方法,所述分类模型训练时所利用的样本数据集中,每个样本数据具有一分类标签,且预先将各个样本数据的分类标签,按照语义划分为具有上下位关系的至少两个层级,每一分类标签属于一个层级;该方法包括:
确定待训练的分类模型所需训练阶段的目标数量;
针对所述目标数量个训练阶段中的每一训练阶段,确定该训练阶段对应的目标层级,利用所述样本数据集中,所述目标层级的分类标签对应的样本数据,对所述分类模型进行训练,在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程;其中,所述目标数量个训练阶段中,至少有两个训练阶段对应的目标层级不同;
在最后一个训练阶段结束后,将当前训练得到的分类模型作为训练完成的分类模型。
可选地,针对所述目标数量个训练阶段中的第一个训练阶段,所述确定该训练阶段对应的目标层级的步骤,包括:
将所述至少两个层级中的顶层,作为该第一个训练阶段对应的目标层级;
针对所述目标数量个训练阶段中的最后一个训练阶段,所述确定该训练阶段对应的目标层级的步骤,包括:
将所述至少两个层级中的所有层级,作为该最后一个训练阶段对应的目标层级。
可选地,所述目标数量为大于2时,针对所述目标数量个训练阶段中,除第一个训练阶段和最后一个训练阶段以外的每一中间训练阶段,所述确定该训练阶段对应的目标层级的步骤,包括:
将所述顶层以及该中间训练阶段对应的预定中间层,作为该中间训练阶段对应的目标层级;
其中,每一中间训练阶段对应的预定中间层包括:除所述顶层和底层以外的一个或多个层级。
可选地,所述目标数量与所述至少两个层级的层级数量相同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910113211.9/2.html,转载请声明来源钻瓜专利网。