[发明专利]基于ohem的语义分割模型训练方法及其系统在审
申请号: | 202010215590.5 | 申请日: | 2020-03-25 |
公开(公告)号: | CN111091164A | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | 袁施薇;李发成;张如高;虞正华 | 申请(专利权)人: | 魔视智能科技(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06K9/34 |
代理公司: | 上海远同律师事务所 31307 | 代理人: | 许力;张坚 |
地址: | 201203 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ohem 语义 分割 模型 训练 方法 及其 系统 | ||
本发明涉及一种基于ohem的语义分割模型训练方法,包括以下步骤:一、计算每个类别的损失函数:二、将每个类别的损失函数进行加权平均,得到最终的分割损失函数;三、使用梯度反传策略对所述语义分割模型进行迭代优化。本发明针对在分割任务中正负样本比例严重不均匀时模型效果较差的问题,提出一种新的分割模型训练方法,该方法平衡正负样本比例对模型进行训练,加大正样本在训练过程中的权重,优选选取难样本,提高了分割任务的效果和训练速度。
技术领域
本发明涉及语义分割技术领域,尤其涉及一种基于ohem的语义分割模型训练方法及其系统。
背景技术
随着计算机视觉的发展,更多基于视觉的感知技术在业界得到了应用,常用的目标识别技术包括目标检测、语义分割、实例分割等,帮助任务定位和识别目标信息,以完成后续工作,例如自动驾驶。如何得到更加精准地检测边界框、如何得到更加精准的分割图,也是学术界和业界的重要研究方向,现已提出很多提升技巧。其中,语义检测任务是指,输入一张图片,分类图片中每个像素点的类别,得到与原图对应的分割图,从而根据这些类别信息完成后续任务。例如我们得到车辆行驶途中前方图片,进而得到行人的分割图,根据相机内参得到与行人的距离,提前做出预警以防撞上。然而,行人相对于图片总体像素而言,所占比例较小,这种不平衡会使得分割模型训练结果比较差。
发明内容
基于此,针对上述技术问题,提供一种基于ohem的语义分割模型训练方法及其系统。
为解决上述技术问题,本发明采用如下技术方案:
一种基于ohem的语义分割模型训练方法,包括以下步骤:
一、计算每个类别的损失函数:
a、将样本图片输入语义分割模型,得到图片中各像素属于各类别的置信度p;
b、取对于当前类别的所有正样本像素点,通过公式(1)计算损失函数:
(1),
其中,表示样本像素点标签,表示像素点的像素坐标;
c、从剩下的所有负样本像素点中按置信度由大到小的顺序,且按照正负样本数量1:m的比例取出负样本像素点,并通过公式(1)计算损失函数,m1;
二、将每个类别的损失函数进行加权平均,得到最终的分割损失函数;
三、通过步骤二得到分割损失函数,使用梯度反传策略对所述语义分割模型进行迭代优化。
所述语义分割模型采用Deeplabv3+模型。
在步骤一中:
若正样本像素点数量过少,即n/(1+m)时,则在步骤b中取对于当前类别的所有正样本像素点,在步骤c中按置信度由大到小取出个负样本像素点,并按置信度由大到小取部分负样本像素点作为正样本像素点,以满足正样本像素点最小选取数/(m+1);
若正样本像素点数量过多,即(1+m)*n大于所有像素点的数量,则在步骤c中取出所有负样本像素点;
其中,n为步骤b中所取的正样本像素点的数量,为预设的负样本像素点最小选取数量。
所述m为3。
本发明还涉及一种基于ohem的语义分割模型训练系统,包括存储模块,所述存储模块包括由处理器加载并执行的多条指令:
一、计算每个类别的损失函数:
a、将样本图片输入语义分割模型,得到图片中各像素属于各类别的置信度p;
b、取对于当前类别的所有正样本像素点,通过公式(1)计算损失函数:
(1),
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于魔视智能科技(上海)有限公司,未经魔视智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010215590.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种变速器用自动换挡装置
- 下一篇:一种图像的细粒度识别方法