[发明专利]识别图像中对象序列的方法、训练方法、装置及设备在审
申请号: | 202180002757.2 | 申请日: | 2021-09-28 |
公开(公告)号: | CN114127804A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 马佳彬;牛达明;吴金易;陈景焕;刘春亚 | 申请(专利权)人: | 商汤国际私人有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/74;G06V10/764;G06V10/82;G06N3/08;G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 艾佳 |
地址: | 新加坡新加坡市新加坡广*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 图像 对象 序列 方法 训练 装置 设备 | ||
1.一种识别图像中的对象序列的方法,所述方法包括:
获取目标图像,所述目标图像中包括由多个对象沿着第一方向堆叠形成的目标对象序列;
根据神经网络确定所述目标对象序列中各个对象的类别;
其中,所述神经网络基于目标损失训练得到,所述目标损失基于样本图像的特征与第一辅助图像的特征之间的第一差异度、以及所述样本图像的特征与第二辅助图像的特征之间的第二差异度确定,所述第一辅助图像中的第一对象序列与所述样本图像中的样本对象序列相同,所述第二辅助图像中的第二对象序列与所述样本图像中的样本对象序列不同,所述样本图像的特征、所述第一辅助图像的特征以及所述第二辅助图像的特征均通过所述神经网络提取得到。
2.根据权利要求1所述的方法,其中,在第一预设损失值范围内,所述目标损失与所述第一差异度正相关,所述目标损失与所述第二差异度负相关。
3.根据权利要求1或2所述的方法,其中,所述目标损失包括:
第一损失,基于所述样本图像中的样本对象序列的类别的预测结果与真实结果之间的偏差确定;
第二损失,基于所述第一差异度以及所述第二差异度确定。
4.根据权利要求3所述的方法,其中,所述第二损失基于如下方式确定:
确定所述样本图像中的样本对象序列与所述第二辅助图像中的第二对象序列的编辑距离,所述编辑距离用于表征所述样本对象序列按照指定变换方式变换到所述第二对象序列所需的变换次数,其中,所述指定变换方式包括对象的删除、对象的增加以及对象的替换;
基于所述第一差异度、所述第二差异度以及所述编辑距离确定所述第二损失。
5.根据权利要求4所述的方法,其中,基于所述第一差异度、所述第二差异度以及所述编辑距离确定所述第二损失,包括:
基于所述编辑距离确定所述第二差异度对应的权重参数;
基于所述第一差异度与利用所述权重参数加权后的第二差异度之间的差值确定所述第二损失。
6.根据权利要求5所述的方法,其中,所述基于所述编辑距离确定所述第二差异度对应的权重参数,包括:
在所述编辑距离大于预设距离的情况下,确定所述第二差异度对应的权重参数为1;
在所述编辑距离小于或等于所述预设距离的情况下,确定所述第二差异度对应的权重参数为与所述编辑距离正相关且不大于1的值。
7.根据权利要求4-6任一项所述的方法,其中,在第二预设损失值范围内,所述第二损失与所述编辑距离正相关。
8.根据权利要求3-7任一项所述的方法,其中,所述第二损失不小于0。
9.根据权利要求3-8任一项所述的方法,其中,基于所述样本图像中的样本对象序列的类别的预测结果与真实结果之间的偏差确定第一损失,包括:
确定所述样本图像中的样本对象序列的类别的预测结果与真实结果之间的第一偏差;
确定所述第一辅助图像中的第一对象序列的类别的预测结果与真实结果之间的第二偏差;
确定所述第二辅助图像中的第二对象序列的类别的预测结果与真实结果之间的第三偏差;
基于所述第一偏差、所述第二偏差以及所述第三偏差确定所述第一损失。
10.根据权利要求1-9任一项所述的方法,其中,
所述第一差异度通过所述样本图像的特征对应的向量与所述第一辅助图像的特征对应的向量之间的距离表征;所述第二差异度通过所述样本图像的特征对应的向量与所述第二辅助图像的特征对应的向量之间的距离表征。
11.根据权利要求1-10任一项所述的方法,其中,所述目标对象序列中的多个对象包括片状对象,所述第一方向包括所述片状对象的厚度方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于商汤国际私人有限公司,未经商汤国际私人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180002757.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有声阻尼性能的楔形多层中间层
- 下一篇:导热性树脂组合物和使用其的导热性片
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序