[发明专利]识别图像中对象序列的方法、训练方法、装置及设备在审
申请号: | 202180002757.2 | 申请日: | 2021-09-28 |
公开(公告)号: | CN114127804A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 马佳彬;牛达明;吴金易;陈景焕;刘春亚 | 申请(专利权)人: | 商汤国际私人有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/74;G06V10/764;G06V10/82;G06N3/08;G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 艾佳 |
地址: | 新加坡新加坡市新加坡广*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 图像 对象 序列 方法 训练 装置 设备 | ||
本公开提供一种识别图像中对象序列的方法、训练方法、装置及设备。在训练用于识别图像中的对象序列的神经网络时,可以同时输入样本图像、第一辅助图像以及第二辅助图像,第一辅助图像中的第一对象序列与样本图像的样本对象序列相同,第二辅助图像中的第二对象序列与样本图像的样本对象序列不同,利用神经网络提取样本图像、第一辅助图像以及第二辅助图像的特征,在构建目标损失时,可以利用样本图像的特征与第一辅助图像的特征之间的差异度、以及样本图像的特征与第二辅助图像的特征之间的差异度构建目标损失。
相关申请的交叉引用
本公开要求于2021年9月24日提交的新加坡专利申请No.10202110631T的优先权,并且该申请的全部内容通过引用并入本文。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种识别图像中对象序列的方法、训练方法、装置及设备。
背景技术
在一些场景,需要对图像中由多个对象堆叠而成的对象序列进行识别,以确定对象序列中各个对象的类别及属性。然而,由于对象序列中堆叠的对象之间往往比较相似,且不同对象在堆叠过程中组合方式也比较多,导致要准确识别对象序列中的各对象的类别比较困难,相关技术中,对图像中对象序列的识别结果的准确度往往较低,仍有待提高。
发明内容
本公开提供一种识别图像中对象序列的方法、训练方法、装置及设备。
根据本公开实施例的第一方面,提供一种识别图像中对象序列的方法,所述方法包括:获取目标图像,所述目标图像中包括由多个对象沿着第一方向堆叠形成的目标对象序列;根据预先训练的神经网络确定所述目标图像中的目标对象序列中各个对象的类别;其中,所述神经网络基于构建的目标损失训练得到,所述目标损失基于所述样本图像的特征与第一辅助图像的特征之间的第一差异度、以及所述样本图像的特征与第二辅助图像的特征之间的第二差异度确定,所述第一辅助图像中的第一对象序列与所述样本图像中的样本对象序列相同,所述第二辅助图像中的第二对象序列与所述样本图像中的样本对象序列不同,所述样本图像的特征、所述第一辅助图像的特征以及所述第二辅助图像的特征均通过所述神经网络提取得到。
在一些实施例中,在第一预设损失值范围内,所述目标损失与所述第一差异度正相关,所述目标损失与所述第二差异度负相关。
在一些实施例中,所述目标损失包括第一损失和第二损失,所述第一损失基于所述样本图像中的样本对象序列的类别的预测结果与真实结果的偏差确定;所述第二损失基于所述第一差异度以及所述第二差异度确定。
在一些实施例中,所述第二损失基于如下方式确定:确定所述样本图像的对象序列与所述第二辅助图像的对象序列的编辑距离,所述编辑距离用于表征所述样本图像的对象序列按照指定变换方式变换到所述第二辅助图像的对象序列的变换次数,其中,所述指定变换方式包括:删除对象、增加对象以及替换对象;基于所述第一差异度、所述第二差异度以及所述编辑距离确定所述第二损失。
在一些实施例中,基于所述第一差异度、所述第二差异度以及所述编辑距离确定所述第二损失,包括:基于所述编辑距离确定所述第二差异度对应的权重参数;基于所述第一差异度与利用所述权重参数加权后的第二差异度的差值确定所述第二损失。
在一些实施例中,所述基于所述编辑距离确定所述第二差异度对应的权重参数,包括:在所述编辑距离大于预设距离的情况下,确定所述第二差异度对应的权重参数为1;在所述编辑距离小于或等于所述预设距离的情况下,确定所述第二差异度对应的权重参数为与所述编辑距离正相关且不大于1的值。
在一些实施例中,在第二预设损失值范围内,所述第二损失与所述编辑距离正相关。
在一些实施例中,所述第二损失不小于0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于商汤国际私人有限公司,未经商汤国际私人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180002757.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有声阻尼性能的楔形多层中间层
- 下一篇:导热性树脂组合物和使用其的导热性片
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序