[发明专利]利用软交叉熵损失的语义分段在审
申请号: | 201980073301.8 | 申请日: | 2019-10-10 |
公开(公告)号: | CN113056769A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 儿嶋环 | 申请(专利权)人: | 索尼集团公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 周磊 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 交叉 损失 语义 分段 | ||
1.一种系统,包括:
电路系统,被配置为:
将第一彩色图像输入到用于多类分类任务的语义分段网络的输入层,
其中语义分段网络基于输入的第一彩色图像以辅助步幅生成第一特征图,作为语义分段网络的辅助层的输出,
从辅助层提取生成的第一特征图;
基于提取出的第一特征图,将概率图计算为多类分类任务的类集合上的软标签的集合;
针对所述辅助步幅计算该计算出的概率图与地面真实概率图之间的辅助交叉熵损失;以及
基于计算出的辅助交叉熵损失来训练用于多类分类任务的语义分段网络。
2.根据权利要求1所述的系统,其中语义分段网络包括编码器网络和连接到编码器网络的输出端的解码器网络,
编码器网络以初始步幅接收第一彩色图像作为输入,并且以第一步幅输出第二特征图,
第一步幅是初始步幅的倍数,以及
解码器网络以第一步幅接收第二特征图,并且以初始步幅输出回去最终分数图。
3.根据权利要求2所述的系统,其中电路系统还被配置为基于语义分段网络的性能度量从语义分段网络的解码器网络中选择辅助层。
4.根据权利要求2所述的系统,其中辅助步幅对应于第一特征图的尺寸与第一彩色图像的尺寸的比率,以及
第一步幅对应于第二特征图的尺寸与第一彩色图像的尺寸的比率。
5.根据权利要求2所述的系统,其中编码器网络包括输入层、密集块的序列、过渡层的序列、金字塔空间池化层和空间路径块,
解码器网络包括上采样层、卷积层、池化层、评分层和输出层,并且
空间路径块从密集块的序列之一分支出来,并利用解码器网络的池化层合并回去。
6.根据权利要求5所述的系统,其中密集块的序列中的每个密集块包括第一批归一化层、1×1卷积层、第二批归一化层、3×3逐深度(DW)可分离卷积层、1×1逐点(PW)可分离卷积层以及级联层。
7.根据权利要求1所述的系统,其中语义分段网络分支成空间路径和上下文路径,
在语义分段网络的输出层之前将空间路径和上下文路径池化回去,
在训练语义分段网络的同时,空间路径以语义分段网络的每个步幅保留第一彩色图像的空间信息,以及
在训练语义分段网络的同时,上下文路径以每个步幅保留第一彩色图像的语义上下文信息。
8.根据权利要求1所述的系统,其中电路系统还被配置为基于语义分段网络的辅助层之前的一个或多个层的概率图,以辅助步幅将地面真实概率图计算为所述类集合上的多标签概率分布。
9.根据权利要求1所述的系统,其中电路系统还被配置为:
从语义分段网络的输出层提取最终分数图,
其中最终分数图与语义分段网络的针对输入的彩色图像的输出对应;以及
基于提取出的最终分数图来计算最终交叉熵损失。
10.根据权利要求9所述的系统,其中计算出的最终交叉熵损失是直方图加权的soft-max交叉熵损失。
11.根据权利要求9所述的系统,其中电路系统还被配置为:
基于计算出的辅助交叉熵损失和计算出的最终交叉熵损失来估计语义分段网络的全局损失度量;以及
基于估计出的全局损失度量来训练语义分段网络。
12.根据权利要求11所述的系统,其中语义分段网络的训练对应于更新用于语义分段网络的不同层的权重直到估计出的全局损失度量最小为止。
13.根据权利要求1所述的系统,其中多类分类任务对应于将第一彩色图像的每个像素分类为所述类集合之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼集团公司,未经索尼集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980073301.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:镜头组件和包括该镜头组件的电子装置
- 下一篇:用于视频译码的头参数集