[发明专利]模型训练方法、装置及电子设备在审
申请号: | 202211210701.9 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115423094A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 夏春龙 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06F16/45;G06V10/764;G06V10/82;G06V10/40;G06V10/26 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 刘念 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 | ||
本公开提供了一种模型训练方法、装置及电子设备,涉及人工智能技术领域,具体涉及深度学习技术领域。具体实现方案为:获取目标场景下的第一数据集,第一数据集包括目标场景下的M个历史多媒体数据;基于第一预测数据,确定M个历史多媒体数据对应的M个第一采样概率,第一预测数据为基于第一训练数据集对第一模型进行第K次迭代训练中输出的预测数据,第一训练数据集包括从所述第一数据集中选取的历史多媒体数据;基于M个第一采样概率,从第一数据集中选取N个历史多媒体数据,得到第二训练数据集;基于第二训练数据集,对第一模型进行第K+1次迭代训练,得到第二预测数据;基于第二预测数据,确定目标模型。
技术领域
本公开涉及人工智能技术领域,尤其涉及深度学习技术领域,具体涉及一种模型训练方法、装置及电子设备。
背景技术
随着人工智能技术的高速发展,深度学习技术得到了广泛的应用。利用海量的数据来驱动深度学习模型优化,比手工设计更加简单和高效,效果也会更加的显著。
在深度学习模型中,数据在整个模型的优化过程中扮演着至关重要的作用。因此,在模型训练过程中,如何从海量数据中选取深度学习模型的训练数据至关重要。
目前,模型训练过程中的数据采样方案通常有随机采样法、类别采样法、任务采样法等。
发明内容
本公开提供了一种模型训练方法、装置及电子设备。
根据本公开的第一方面,提供了一种模型训练方法,包括:
获取目标场景下的第一数据集,所述第一数据集包括所述目标场景下的M个历史多媒体数据,M为大于1的整数;
基于第一预测数据,确定所述M个历史多媒体数据对应的M个第一采样概率,所述第一预测数据为基于第一训练数据集对第一模型进行第K次迭代训练中输出的预测数据,所述第一训练数据集包括从所述第一数据集中选取的历史多媒体数据,所述第一采样概率指示所述历史多媒体数据在所述第一数据集中被选取的概率,K为正整数;
基于所述M个第一采样概率,从所述第一数据集中选取N个历史多媒体数据,得到第二训练数据集,N为大于1的整数;
基于所述第二训练数据集,对所述第一模型进行第K+1次迭代训练,得到第二预测数据;
基于所述第二预测数据,确定由所述第一模型训练得到的目标模型,所述目标模型用于对所述目标场景下的多媒体数据进行处理。
根据本公开的第二方面,提供了一种模型训练装置,包括:
获取模块,用于获取目标场景下的第一数据集,所述第一数据集包括所述目标场景下的M个历史多媒体数据,M为大于1的整数;
第一确定模块,用于基于第一预测数据,确定所述M个历史多媒体数据对应的M个第一采样概率,所述第一预测数据为基于第一训练数据集对第一模型进行第K次迭代训练中输出的预测数据,所述第一训练数据集包括从所述第一数据集中选取的历史多媒体数据,所述第一采样概率指示所述历史多媒体数据在所述第一数据集中被选取的概率,K为正整数;
选取模块,用于基于所述M个第一采样概率,从所述第一数据集中选取N个历史多媒体数据,得到第二训练数据集,N为大于1的整数;
迭代训练模块,用于基于所述第二训练数据集,对所述第一模型进行第K+1次迭代训练,得到第二预测数据;
第二确定模块,用于基于所述第二预测数据,确定由所述第一模型训练得到的目标模型,所述目标模型用于对所述目标场景下的多媒体数据进行处理。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211210701.9/2.html,转载请声明来源钻瓜专利网。