[发明专利]模型训练、样本生成方法、电子设备及存储介质在审
申请号: | 201910492711.8 | 申请日: | 2019-06-06 |
公开(公告)号: | CN112053366A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 詹鹏鑫;杨昌源;刘奎龙;李为;陈国君;王利华;戚亚骏 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/194;G06F16/63 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱;刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 样本 生成 方法 电子设备 存储 介质 | ||
1.一种模型训练方法,其特征在于,包括:
根据第一数量的目标图像样本和第二数量的背景图像样本进行图像合成处理,得到第三数量的训练样本;其中,第三数量大于第一数量和第二数量之和;
根据所述第三数量的训练样本,训练图像分割模型。
2.根据权利要求1所述的方法,其特征在于,响应训练图像分割模型的请求,根据第一数量的目标图像样本和第二数量的背景图像样本进行图像合成处理,得到第三数量的训练样本,包括:
响应所述训练图像分割模型的请求,基于第一线程对所述第一数量的目标图像样本和所述第二数量的背景图像样本进行图像合成处理,得到所述第三数量的训练样本,并将所述第三数量的训练样本存储至样本队列;
根据所述第三数量的训练样本,训练所述图像分割模型,包括:
基于第二线程从所述样本队列中读取至少一张训练样本,并根据所述至少一张训练样本训练所述图像分割模型。
3.根据权利要求2所述的方法,其特征在于,基于第一线程对所述第一数量的目标图像样本和所述第二数量的背景图像样本进行图像合成处理,包括:
基于所述第一线程从目标图像样本数据库中读取所述第一数量的目标图像样本;以及,按照背景图像样本对应的读取概率,从所述背景图像样本数据库中读取所述第二数量的背景图像样本;
将所述第一数量的目标图像样本中的每张目标图像样本分别与所述第二数量的背景图像样本进行图像合成处理。
4.根据权利要求3所述的方法,其特征在于,还包括:
获取训练样本的分布特征;
根据所述训练样本的分布特征,确定所述背景图像样本数据库中的背景图像样本对应的读取概率。
5.根据权利要求4所述的方法,其特征在于,根据所述训练样本的分布特征,确定所述背景图像样本数据库中的背景图像样本对应的读取概率,包括:
根据所述训练样本的分布特征,增加与指定背景匹配的背景图像样本的读取概率;和/或,增加复杂度大于设定的复杂度阈值的背景图像样本的读取概率。
6.根据权利要求1所述的方法,其特征在于,根据第一数量的目标图像样本和第二数量的背景图像样本进行图像合成处理,得到第三数量的训练样本之后,还包括:
对所述第三数量的训练样本进行图像增强处理,以优化所述第三数量的训练样本。
7.根据权利要求6所述的方法,其特征在于,对所述第三数量的训练样本进行图像增强处理,包括:
对所述第三数量的训练样本进行以下至少一种颜色优化处理:亮度均衡处理、对比度均衡处理、边缘模糊处理以及色彩变换处理;
和/或,
对所述第三数量的训练样本进行以下至少一种空间变换处理:镜像翻转处理、旋转处理以及局部缩放处理。
8.根据权利要求2所述的方法,其特征在于,基于第二线程从所述样本队列中读取至少一张训练样本,并根据所述至少一张训练样本训练所述图像分割模型,包括:
基于所述第二线程,从所述样本队列中读取至少一张训练样本;
将所述至少一张训练样本输入神经网络模型,以使所述神经网络模型的输出层输出所述至少一张训练样本的预测分割结果;
在所述神经网络模型的损失层根据所述预测分割结果中,所述至少一张训练样本上的像素的预测概率以及所述预测概率和损失函数计算权重的负相关关系,计算第一损失函数;以及,根据所述预测分割结果提供的目标图像或背景图像的预测边界的分布特征,计算第二损失函数;并根据所述第一损失函数和所述第二损失函数,计算所述神经网络模型的混合损失函数;
根据所述混合损失函数,迭代训练所述神经网络模型,以得到所述图像分割模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910492711.8/1.html,转载请声明来源钻瓜专利网。