[发明专利]一种工业图像智能分割压缩方法有效
申请号: | 201910838019.6 | 申请日: | 2019-09-05 |
公开(公告)号: | CN112446376B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 郑泽宇;高原;许原野;张涛;董静雅;刘智 | 申请(专利权)人: | 中国科学院沈阳自动化研究所 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/26;G06V10/44;G06V10/774;G06V10/82;G06N3/0464;G06N3/08;H04N19/119 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 许宗富 |
地址: | 110016 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 工业 图像 智能 分割 压缩 方法 | ||
本发明涉及一种工业图像智能分割压缩方法。包括以下步骤:选取需处理的工业图像样本,人工标注真实兴趣框;输入卷积神经网络模型获取特征图;在特征图上的每一个点上生成不同大小与宽高比例的锚框;根据与真实兴趣框的重合程度提取锚框中的正负样本进行训练,根据正样本对锚框边框进行回归修正;采集现场工业图像生成锚框,使用训练好的锚框分类与边框回归器生成修正后的锚框,去重操作,提取正样本概率较高的锚框作为候选框;根据提出的候选区框,对工业图像进行分割存储。本方法针对工业图像中语义冗余信息较多,种类繁多但同类图像差别不大的特点,利用区域推荐网络,通过对少量样本的学习,减小了工业图像的大小,可以节省大量的存储空间。
技术领域
本发明涉及工业图像压缩与人工智能两个交叉领域,具体说是利用人工智能技术,截取工业图像中人们真正感兴趣的部分,从而达到压缩的效果。
背景技术
工业图像处理对工业有着重要作用,常用的工业图像处理包括:元件表面检测、元件尺寸检测、元件位置校准、激光定位打印等。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。数据压缩的任务是在不影响或者少影响图像质量的前提下,尽量减少表示数字图像时需要的数据量,其首要任务在于去除图像中的各种冗余数据。现有的图像压缩方法主要有,无损压缩方法,如行程长度编码法、熵编码法等,有损压缩方法,如色度抽样、变换编码、分形压缩等。该方法有以下不足:1)在大部分的工业图像中,人们感兴趣的图像只占整张图片的一部分,对整张图片进行压缩处理,会降低传输图片时的效率,同时浪费大量的存储空间。2)工业图像种类繁多,数量较大,但是同种工业设备产生的图像一般变化不大;现有的图像压缩技术利用图像本身的像素信息,在整张图片上进行压缩操作,而没有考虑具体的语义信息。3)现有的图像压缩技术较为成熟,没有太大的改进空间。
发明内容
针对上述技术不足,本发明的目的提供一种工业图像智能分割压缩方法。该方法利用工业图像中语义冗余信息较多,种类繁多但同种工业设备产生的图像差别不大,易学习的特点,利用少量的人工标注的训练样本,学习到该类工业图像中人们真正感兴趣的区域,并利用学习到的兴趣区域,合并分割出最终需要存储的工业图像。该方法不需要任何传统的图像处理技术,利用当前人工智能与图像检测领域中通用性强的区域推荐网络,降低了使用门槛,可以适用于大部分的工业图像;对于每类工业图像,只需要少量的数据标注与模型训练,迁移成本较低且效果较好。
本发明解决其技术问题所采用的技术方案是:一种工业图像智能分割压缩方法,包括如下步骤:
离线训练的步骤:工业图像预处理后输入卷积神经网络模型得到特征图,对特征图生成不同尺寸的多个锚框,再进行锚框二分类器训练得到锚框分类与边框回归器;
实际处理的步骤:采集现场工业图像,输入训练好的卷积神经网络模型、锚框分类与边框回归器,生成修正后的锚框并去重操作,提取锚框候选框;合并候选框并从工业图像中分割出来。
所述工业图像预处理包括:
选取需要处理的工业图像样本,人工标注真实兴趣框。
所述卷积神经网络模型包括:卷积层,激活函数,池化层,批标准化层;
卷积层:y=conv2d(x,W,bias,stride),x为输入特征,w为卷积核大小,bias是卷积操作后要加的偏差,stride为卷积操作的步长;
Relu激活函数:y=max(0,x);
池化层:y=maxpool2d(x,size,stride),x为输入特征,size为池化操作窗口大小,stride是池化窗口在特征图上的移动步长。
批标准化(batch normalization,BN)层:即把每次神经网络的输出都归一化为标准正态分布,从而使网络更好的收敛。
所述对特征图生成不同尺寸的多个锚框包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳自动化研究所,未经中国科学院沈阳自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910838019.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可自锁型连接装置
- 下一篇:光学邻近修正、光掩膜版制作及图形化方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序