[发明专利]基于ohem的语义分割模型训练方法及其系统在审

申请号：	202010215590.5	申请日：	2020-03-25
公开（公告）号：	CN111091164A	公开（公告）日：	2020-05-01
发明（设计）人：	袁施薇;李发成;张如高;虞正华	申请（专利权）人：	魔视智能科技（上海）有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/00;G06K9/34
代理公司：	上海远同律师事务所 31307	代理人：	许力;张坚
地址：	201203 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 ohem 语义分割模型训练方法及其系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于ohem的语义分割模型训练方法，包括以下步骤：一、计算每个类别的损失函数：二、将每个类别的损失函数进行加权平均，得到最终的分割损失函数；三、使用梯度反传策略对所述语义分割模型进行迭代优化。本发明针对在分割任务中正负样本比例严重不均匀时模型效果较差的问题，提出一种新的分割模型训练方法，该方法平衡正负样本比例对模型进行训练，加大正样本在训练过程中的权重，优选选取难样本，提高了分割任务的效果和训练速度。

技术领域

本发明涉及语义分割技术领域，尤其涉及一种基于ohem的语义分割模型训练方法及其系统。

背景技术

随着计算机视觉的发展，更多基于视觉的感知技术在业界得到了应用，常用的目标识别技术包括目标检测、语义分割、实例分割等，帮助任务定位和识别目标信息，以完成后续工作，例如自动驾驶。如何得到更加精准地检测边界框、如何得到更加精准的分割图，也是学术界和业界的重要研究方向，现已提出很多提升技巧。其中，语义检测任务是指，输入一张图片，分类图片中每个像素点的类别，得到与原图对应的分割图，从而根据这些类别信息完成后续任务。例如我们得到车辆行驶途中前方图片，进而得到行人的分割图，根据相机内参得到与行人的距离，提前做出预警以防撞上。然而，行人相对于图片总体像素而言，所占比例较小，这种不平衡会使得分割模型训练结果比较差。

发明内容

基于此，针对上述技术问题，提供一种基于ohem的语义分割模型训练方法及其系统。

为解决上述技术问题，本发明采用如下技术方案：

一种基于ohem的语义分割模型训练方法，包括以下步骤：

一、计算每个类别的损失函数：

a、将样本图片输入语义分割模型，得到图片中各像素属于各类别的置信度p；

b、取对于当前类别的所有正样本像素点，通过公式（1）计算损失函数：

（1），

其中，表示样本像素点标签,表示像素点的像素坐标；

c、从剩下的所有负样本像素点中按置信度由大到小的顺序，且按照正负样本数量1：m的比例取出负样本像素点，并通过公式（1）计算损失函数,m1；

二、将每个类别的损失函数进行加权平均，得到最终的分割损失函数；

三、通过步骤二得到分割损失函数，使用梯度反传策略对所述语义分割模型进行迭代优化。