[发明专利]一种工业图像智能分割压缩方法有效
申请号: | 201910838019.6 | 申请日: | 2019-09-05 |
公开(公告)号: | CN112446376B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 郑泽宇;高原;许原野;张涛;董静雅;刘智 | 申请(专利权)人: | 中国科学院沈阳自动化研究所 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/26;G06V10/44;G06V10/774;G06V10/82;G06N3/0464;G06N3/08;H04N19/119 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 许宗富 |
地址: | 110016 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 工业 图像 智能 分割 压缩 方法 | ||
1.一种工业图像智能分割压缩方法,其特征在于包括如下步骤:
离线训练的步骤:工业图像预处理后输入卷积神经网络模型得到特征图,对特征图生成不同尺寸的多个锚框,再进行锚框二分类器训练得到锚框分类与边框回归器;所述锚框二分类器训练包括:
i.根据与真实兴趣框的重合程度提取锚框中的正负样本;
ii.根据正负样本对锚框二分类器进行训练,同时根据正样本对锚框边框进行回归修正,使锚框与真实兴趣框的重合度越来越高;包括:
a.定义锚框的位置坐标:
tx=(x-xa)/wa,ty=(y-ya)/ha,tw=log(w/wa),th=log(h/ha),
x,y,w,h分别代表的矩形框的中心横坐标、中心纵坐标、宽和高,x,xa,x*分别代表横坐标的预测值、锚框值与真实值,y,ya,y*分别代表纵坐标的预测值、锚框值与真实值,w,wa,w*分别代表宽的预测值、锚框值与真实值,h,ha,h*分别代表高的预测值、锚框值与真实值;
b.定义最小化目标函数L({pi},{ti})由两部分组成如下:
i代表锚框的索引,pi代表第i个锚框是真实兴趣框的概率,如果锚框是正样本标签,则为1,如果锚框是负样本标签,则为0,ti是包含上述tx,ty,tw,th四个预测框参数化信息的向量,是包含上述四个真实兴趣框参数化信息的向量,Lcls是前景与背景的交叉熵损失函数,Lreg代表其中R是smooth L1函数,具体形式如下:
损失函数的两个部分分别用Ncls与Nreg来标准化,λ是平衡两部分损失函数的参数;
c.通过调整损失函数输出的pi与ti参数,对锚框进行修正,使其越来越靠近真实兴趣框;
实际处理的步骤:采集现场工业图像,输入训练好的卷积神经网络模型、锚框分类与边框回归器,生成修正后的锚框并去重操作,提取锚框候选框;合并候选框并从工业图像中分割出来。
2.根据权利要求1所述的一种工业图像智能分割压缩方法,其特征在于所述工业图像预处理包括:
选取需要处理的工业图像样本,人工标注真实兴趣框。
3.根据权利要求1所述的一种工业图像智能分割压缩方法,其特征在于所述卷积神经网络模型包括:卷积层,激活函数,池化层,批标准化层;
卷积层:y=conv2d(x,W,bias,stride),x为输入特征,w为卷积核大小,bias是卷积操作后要加的偏差,stride为卷积操作的步长;
Relu激活函数:y=max(0,x);
池化层:y=maxpool2d(x,size,stride),x为输入特征,size为池化操作窗口大小,stride是池化窗口在特征图上的移动步长;
批标准化(batch normalization,BN)层:即把每次神经网络的输出都归一化为标准正态分布,从而使网络更好的收敛。
4.根据权利要求1所述的一种工业图像智能分割压缩方法,其特征在于所述对特征图生成不同尺寸的多个锚框包括:
在图像特征图上的每一个点上生成不同面积大小与宽高比例的n个锚框,则一共产生w*h*n个锚框;其中,特征图的大小为(w,h,c),w,h,c分别代表特征图的宽、高、通道数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳自动化研究所,未经中国科学院沈阳自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910838019.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可自锁型连接装置
- 下一篇:光学邻近修正、光掩膜版制作及图形化方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序