[发明专利]图像文本检测训练方法及装置在审
申请号: | 201911351419.0 | 申请日: | 2019-12-24 |
公开(公告)号: | CN113033589A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 崔淼 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 文本 检测 训练 方法 装置 | ||
1.一种图像文本检测训练方法,其特征在于,包括以下步骤:
获取训练图像集,所述训练图像集包括多张训练图像;
对每张所述训练图像进行缩放处理,以得到对应的缩放图像;
根据所述缩放图像进行建模处理,以得到对应的预测图像;
采用相同方法分别对所述预测图像及对应的所述训练图像进行渐进分割处理,以得到预测图像分割集及训练图像分割集;
根据loss1=dice(G[n-1],S[n-1])计算第一边界损失函数,其中,loss1是第一边界损失函数,G[n-1]=[g1,g2...gn-1],S[n-1]=[s1,s2...sn-1],dice是欧式距离函数,g1,g2,...,gn-1是对训练图像进行渐进扩展分割处理的结果,s1,s2,...,sn-1是对预测图像进行渐进扩展分割处理的结果;
不断重复上述建模处理、渐进分割处理和计算第一边界损失函数的过程,直至所述第一边界损失函数满足预设条件。
2.如权利要求1所述的方法,其特征在于,所述缩放处理采用下面公式实现:
其中:Area(p)是训练图像的面积,Permeter(p)是训练图像的周长,r是缩放比例,d是缩放距离,r的取值范围包括大于等于0.5且小于1。
3.如权利要求1所述的方法,其特征在于,所述建模处理包括:对所述缩放图像进行特征提取处理以及特征融合处理,以得到预测图像;所述特征提取处理包括:对所述缩放图像进行多次卷积处理,每次所述卷积处理包括一个卷积层和一个归一层;对所述多次卷积处理后的图像进行多次深度学习处理,每次所述深度学习处理依次包括:squeeze层、第一激活层、expand层和第二激活层。
4.如权利要求3所述的方法,其特征在于,所述卷积处理的次数范围包括2—4;所述深度学习处理的次数范围包括9—15。
5.如权利要求3所述的方法,其特征在于,所述特征融合处理包括:选择任一所述卷积层的输出特征图谱以及4—8次所述深度学习处理的squeeze层输出特征图谱进行FPN特征融合。
6.如权利要求1所述的方法,其特征在于,在进行建模处理之前,所述方法还包括:
对每张所述训练图像进行人工标注处理,以得到标注的四个原图边界像素值;
根据所述标注的四个原图边界像素值计算对应的缩放图像的四个缩放边界像素值,并获取标注的右边界区域像素集和标注的左边界区域像素集;
所述建模处理包括:根据所述预测图像与对应的训练图像,得到预测的右边界区域像素集和预测的左边界区域像素集;
在进行建模处理之后,所述方法还包括:
根据loss2=lscore(yr,cr)+lscore(yl,cl)计算第二边界损失函数,其中:loss2代表第二边界损失函数,lscore(yr,cr)是预测的右边界区域像素集yr与标注的右边界区域像素集cr之间的误差,lscore(yl,cl)是预测的左边界区域像素集yl与标注的左边界区域像素集cl之间的误差;
不断重复上述建模处理、渐进分割处理和计算第一边界损失函数的过程,直至所述第一边界损失函数满足预设条件包括:不断重复上述建模处理、计算第一边界损失函数、渐进分割处理以及计算第二边界损失函数的过程,直至所述第一边界损失函数和所述第二边界损失函数之和满足预设条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911351419.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序