[发明专利]一种模型训练方法、装置、设备及介质在审
申请号: | 202310248558.0 | 申请日: | 2023-03-15 |
公开(公告)号: | CN116610944A | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 朱明浩;倪志恒;王龙;陈立力;周明伟 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N20/20 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张洁 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 设备 介质 | ||
本申请实施例提供一种模型训练方法、装置、设备及介质,该方法可以由计算机设备执行,该方法包括:将第一数据集输入训练好的召回模型,基于所述训练好的召回模型得到第一顺序集合;接收第一指令,根据所述第一指令和所述第一顺序集合确定第二顺序集合;将所述第一数据集输入所述排序模型,并基于所述第二顺序集合监督所述排序模型进行训练,得到训练好的排序模型,所述训练好的排序模型用于输入待识别的无标签数据和输出所述待识别的无标签数据对应的M个预设标签的排序,所述M个预设标签的排序用于实现应用的功能。
技术领域
本申请涉及计算机技术领域,具体涉及到一种模型训练方法、装置、设备及介质。
背景技术
在诸如搜索引擎、文字检索等应用中,需要用到排序模型来实现应用的功能。排序模型越精准,应用的功能的性能越好。
在具体实现时,需要大量标签数据对排序模型进行训练,这些标签数据具有多个标签且该多个标签的顺序确定,因此选择高质量的标签数据对排序模型的训练效果为重要。现有技术中,主要通过人工对数据打标签,由于排序模型需要通过大量的标签数据进行训练,人为打标工作量大,效率低,训练排序模型的成本高;并且在打标过程中,容易引起人为失误,导致排序的标签不符合实际需要,即排序的标签准确率低。
发明内容
本申请实施例提供一种模型训练方法、装置、设备及介质,用于解决现有技术中获得排序的标签的效率低、成本高以及排序的标签准确率低的技术问题。
第一方面,本申请实施例提供一种模型训练方法,该方法可以由计算机设备执行,该方法包括:将第一数据集输入训练好的召回模型,基于所述训练好的召回模型得到第一顺序集合;其中,所述第一数据集中包括多条无标签数据,所述训练好的召回模型用于针对输入的每条无标签数据输出N个预设标签的排序,所述第一顺序集合包括所述多条无标签数据中各条无标签数据对应的N个预设标签的排序,所述N为正整数;接收第一指令,根据所述第一指令和所述第一顺序集合确定第二顺序集合;将所述第一数据集输入所述排序模型,并基于所述第二顺序集合监督所述排序模型进行训练,得到训练好的排序模型,所述训练好的排序模型用于输入待识别的无标签数据和输出所述待识别的无标签数据对应的M个预设标签的排序,所述M个预设标签的排序用于实现应用的功能,所述M为小于或等于N的正整数。
在本方案中,训练好的召回模型可以减少不相关的预设标签的数量,提高计算效率;第一顺序集合中的排序是计算机设备计算出的,可能与真实的排序情况存在出入,为此根据第一指令确定出的第二顺序集合克服了第一顺序集合的不足,更加符合真实的排序情况,所以根据第一指令得到的排序的标签(即第二顺序集合)准确率高。综上所述,由于训练排序模型的排序的标签是基于训练好的召回模型与第一指令得到的,获得排序的标签的效率高、成本低,排序的标签准确率高,训练好的排序模型可以更好的实现应用的功能。
可选的,在所述将第一数据集输入训练好的召回模型之前,还包括:获得第二数据集,所述第二数据集中包括至少一条标签数据;基于所述第二数据集训练召回模型,得到所述训练好的召回模型。
通过本方式,计算机设备可以基于第二数据集监督或半监督训练召回模型,召回模型训练效果好,保证了方案的合理性。
可选的,所述接收第一指令,根据所述第一指令和所述第一顺序集合确定第二顺序集合,包括:根据所述第一指令更改所述第一顺序集合中至少一条无标签数据对应的N个预设标签的排序。
通过本方式,计算机设备接收第一指令,根据第一指令和第一顺序集合确定符合实际需要的第二顺序集合。由于第一顺序集合中的一条无标签数据对应的N个预设标签的排序不一定是实际需要的排序,为此重新确定出第二顺序集合,使得第二顺序集合的更好的满足实际需求,进而可以更好的用于排序模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310248558.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双索面斜拉桥防护网
- 下一篇:T型散热器及服务器