[发明专利]图像显著性区域提取方法、装置、计算机设备及存储介质在审
申请号: | 202310601820.5 | 申请日: | 2023-05-25 |
公开(公告)号: | CN116665215A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 陈超;王彬燕;刘子强;王海涛;潘超 | 申请(专利权)人: | 北京航星永志软件技术有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/148;G06V30/19;G06V30/18;G06N3/0464 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李静玉 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 显著 区域 提取 方法 装置 计算机 设备 存储 介质 | ||
本发明涉及图像提取技术领域,公开了一种图像显著性区域提取方法、装置、计算机设备及存储介质,提取方法应用于嵌套式深层语义分割模型中,嵌套式深层语义分割模型包括编码器和解码器;该方法包括:获取待提取的图像;利用编码器对待提取的图像进行编码融合后生成第一编码特征图;利用解码器对第一编码特征图进行解码后生成多通道概率图;对多通道概率图进行阈值过滤和连通域操作确定图像显著性区域。本发明可节省显著性区域提取过程中的人力和时间,解决了基于人工标注的档案图像显著性区域提取成本高,耗时长的问题。
技术领域
本发明涉及图像提取技术领域,具体涉及一种图像显著性区域提取方法、装置、计算机设备及存储介质。
背景技术
随着计算机信息技术的不断发展,互联网信息技术也走过了四个阶段。第一阶段是建立与传输阶段,它包括从网络到计算机硬件设备的建立和传输,以及计算机软件的开发和应用;第二阶段是信息应用与网民崛起,它涉及到网络应用环境的构建和完善;第三阶段是社交与移动崛起,它包括互联网上的社交网络的兴起,以及移动终端的普及和应用;第四阶段是应用与概念并行,智能化兴起,它涉及到大数据、人工智能和物联网等技术。这些技术在不断地发展和完善中,成为推动产业发展的重要力量,也为人们的日常生活带来了便利。
为了解决传统扫描档案中繁杂的问题,档案图像的处理也逐渐由数字化走向智能化。主要困难例如,在对文件进行扫描时,往往会扫描进与显著性区域无关的背景,或由于档案无法拆分而扫描进相邻的页面的内容。用户通常会将注意力集中在扫描页面中包含显著性区域的内容上,而其他不相关的部分需要被去除。即使目前有一些计算机辅助处理手段,但也无法有效地将显著性区域提取出来。另外,由于档案图像的多样性,存在纸张发黄,污损的情况,给显著性区域的甄别提取造成了很大的阻碍。目前,传统的以手动方式对文件进行数字化时,往往要耗费大量的人力物力进行手工标注,从而制约了文档的处理能力。
因此,档案智能化成为了一条行之有效的解决途径。
发明内容
有鉴于此,本发明实施例提供了一种图像显著性区域提取方法、装置、计算机设备及存储介质,以解决基于人工标注的档案图像显著性区域提取成本高,耗时长的问题。
第一方面,本发明实施例提供了一种图像显著性区域提取方法,应用于嵌套式深层语义分割模型中,嵌套式深层语义分割模型包括编码器和解码器;提取方法包括:
获取待提取的图像;
利用编码器对待提取的图像进行编码融合后生成第一编码特征图;
利用解码器对第一编码特征图进行解码后生成多通道概率图;
对多通道概率图进行阈值过滤和连通域操作确定图像显著性区域。
本发明实施例提供的图像显著性区域提取方法,基于嵌套式深层语义分割模型编码器对待提取的图像进行编码融合后生成第一编码特征图,使用嵌套式深层语义分割模型解码器对第一编码特征图进行解码后生成多通道概率图,最后对多通道概率图进行阈值过滤和连通域操作确定图像显著性区域,可大大节省显著性区域提取过程中的人力和时间,解决了基于人工标注的档案图像显著性区域提取成本高,耗时长的问题。
结合第一方面,在一种实施方式中,在利用编码器对待提取的图像进行编码融合后生成第一编码特征图之前,还包括:
对待提取的图像进行纠偏操作得到图像标准图。
本发明实施例提供的图像显著性区域提取方法,对待提取的图像进行纠偏操作得到图像标准图,可以降低嵌套式深层语义分割模型学习的复杂度并且提升模型处理的效果。
在一种可选的实施方式中,利用编码器对待提取的图像进行编码融合后生成第一编码特征图包括:
利用编码器对待提取的图像进行多层下采样特征提取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航星永志软件技术有限公司,未经北京航星永志软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310601820.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序