[发明专利]一种图像的处理方法、装置及网络的训练方法在审
申请号: | 202010623842.8 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111652824A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 张发恩;张建伟 | 申请(专利权)人: | 创新奇智(南京)科技有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
地址: | 211000 江苏省南京市江宁经*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 处理 方法 装置 网络 训练 | ||
本申请提供一种图像的处理方法、装置及网络的训练方法。方法包括:获取待识别对象的原图像;利用预设的干扰屏蔽网络处理所述原图像,以将所述原图像中与所述待识别对象无关的干扰背景滤除,获得滤除后的图像;利用预设的对象识别网络处理所述滤除后的图像,以获得所述待识别对象的识别结果。可以理解到,在开始识别图像中的待识别对象之前,先通过一个前置的干扰屏蔽网络将图像中与待识别对象无关的干扰背景滤除,这样,再利用对象识别网络处理滤除后的图像时则可以避免识别受到背景的干扰,从而极大的提高了识别的准确度。
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种图像的处理方法、装置及网络的训练方法。
背景技术
在各个领域对人工智能技术的应用中,通过人工智能技术对图像中的对象进行识别是最为常规也是最为广泛的应用。但是在识别的过程中,由于图像中往往存在与待识别对象无关的背景元素,而这些背景元素会对对象的识别造成干扰,导致识别结果的准确度不高。
发明内容
本申请实施例的目的在于提供一种图像的处理方法、装置及网络的训练方法,用避免对象识别受到背景的干扰,提高识别的准确度。
第一方面,本申请实施例提供了一种图像的处理方法,所述方法包括:获取待识别对象的原图像;利用预设的干扰屏蔽网络处理所述原图像,以将所述原图像中与所述待识别对象无关的干扰背景滤除,获得滤除后的图像;利用预设的对象识别网络处理所述滤除后的图像,以获得所述待识别对象的识别结果。
在本申请实施例中,在开始识别图像中的待识别对象之前,先通过一个前置的干扰屏蔽网络将图像中与待识别对象无关的干扰背景滤除,这样,再利用对象识别网络处理滤除后的图像时则可以避免识别受到背景的干扰,从而极大的提高了识别的准确度。
结合第一方面,在第一种可能的实现方式中,利用预设的干扰屏蔽网络处理所述原图像,以将所述原图像中与所述待识别对象无关的干扰背景滤除,获得滤除后的图像,包括:利用所述干扰屏蔽网络对所述原图像进行多次的卷积处理,获得区分出所述待识别对象以及所述干扰背景的特征图像;将所述特征图像中的所述干扰背景滤除,获得所述滤除后的图像。
在本申请实施例中,通过卷积处理来清晰的区分出图中哪些特征是属于待识别对象,以及哪些是属于干扰背景,从而实现了全面的将干扰背景滤除,以获得只剩下待识别对象的图像。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,利用所述干扰屏蔽网络对所述原图像进行多次的卷积处理,获得区分出所述待识别对象以及所述干扰背景的特征图像,包括:利用所述干扰屏蔽网络对所述原图像依次进行特征尺度缩小的卷积以及激活处理,获得初始的卷积特征;利用所述干扰屏蔽网络对所述初始的卷积特征依次进行特征尺度不变的卷积以及激活处理,获得第一卷积特征;以及,利用所述干扰屏蔽网络对所述初始的卷积特征依次进行特征尺度缩小的卷积以及激活处理,获得缩小后的卷积特征;以及,还利用所述干扰屏蔽网络对所述缩小后的卷积特征进行上采样处理,获得特征尺度与所述第一卷积特征相同的第二卷积特征;利用所述干扰屏蔽网络将所述第一卷积特征和所述第二卷积特征融合,获得所述特征图像。
在本申请实施例中,通过不同尺度的正卷积来获得特征结构不同的第一卷积特征和第二卷积特征可以使得特征的视野增加,而再将第一卷积特征和第二卷积特征融合则可以更准确提取出干扰背景。此外,在卷积的基础上进行激活处理可以使得处理呈非线性,也可以实现更准确提取出干扰背景。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,利用所述干扰屏蔽网络将所述第一卷积特征和所述第二卷积特征融合,获得所述特征图像,包括:利用所述干扰屏蔽网络将所述第一卷积特征和所述第二卷积特征融合,获得融合特征;利用所述干扰屏蔽网络对所述融合特征进行特征尺度不变的卷积以及分类处理,获得所述特征图像。
在本申请实施例中,融合后再进行正卷积可以更进一步提取出属于干扰背景的第一特征数据,以更准确提取出干扰背景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(南京)科技有限公司,未经创新奇智(南京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010623842.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序