[发明专利]基于改进型EAST算法的文本检测方法有效
申请号: | 201910011376.5 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109740542B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 史天永;翁增仁 | 申请(专利权)人: | 福建博思软件股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 张磊 |
地址: | 350108 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进型 east 算法 文本 检测 方法 | ||
1.一种基于改进型EAST算法的文本检测方法,其特征在于,它包括以下步骤:
S1.采用多通道全卷积网络对输入图像进行处理,输出一个9通道特征图,分别为map0,map1,map2,map3,map4,map5,map6,map7,map8;
S2.对map0中的像素点进行阈值化选择,将符合阈值范围的像素点选定作为激活像素点;
S3.在map1-map8上分别找到激活像素点对应的坐标,并计算出激活像素点所预测文本框的四个顶点坐标;
S4.将各激活像素点预测的文本框根据重合程度进行合并得到多边形polygon,多边形polygon对应的所有激活像素点组成一个集合C;
步骤S4中,计算两激活像素点预测文本框的IoU值,当IoU值大于指定阈值时,将两预测文本框进行合并,并将对应的激活像素点归入集合C内;
S5.从集合C中筛选出靠近对应的预测文本框起始端的激活像素点形成子集合C1以及靠近对应的预测文本框终止端的激活像素点形成子集合C2;
步骤S5中,求集合C中每个激活像素点到其预测文本框起始端两顶点的曼哈顿距离之和dist1与集合C中每个激活像素点到其预测文本框终止端两顶点的曼哈顿距离之和dist2的比值ratio;
根据比值ratio对集合C内所有激活像素点进行排序,取比值最小的前n个激活像素点组成子集合C1,取比值最大的前n个激活像素点组成子集合C2;
S6.通过子集合C1内的激活像素点计算出文本框起始端的两顶点坐标,通过子集合C2内的激活像素点计算出文本框终止端的两顶点坐标;
将子集合C1得到的两顶点坐标与子集合C2得到的两顶点坐标进行合并,形成最终文本框的四个顶点坐标。
2.根据权利要求1所述的基于改进型EAST算法的文本检测方法,其特征在于:步骤S4中,IoU指定阈值的取值范围为(0.3,1)。
3.根据权利要求1所述的基于改进型EAST算法的文本检测方法,其特征在于:步骤S5中,坐标为(x,y)的激活像素点所预测文本框的四个顶点坐标分别为:v1(x1,y1)、v2(x2,y2)、v3(x3,y3)、v4(x4,y4);
ratio=dist1/dist2=(dx1+dy1+dx4+dy4)/(dx2+dy2+dx3+dy3);
其中,dx1=|x1-x|;dy1=|y1-y|;dx2=|x2-x|;dy2=|y2-y|;dx3=|x3-x|;dy3=|y3-y|;dx4=|x4-x|;dy4=|y4-y|。
4.根据权利要求1所述的基于改进型EAST算法的文本检测方法,其特征在于:步骤S6中,对子集合C1中的激活像素点所预测的文本框起始端两顶点按照概率值进行加权平均,得到子集合C1中所有激活像素点所预测的文本框起始端两顶点的坐标c1_v1,c1_v4;
对子集合C2中的激活像素点所预测的文本框终止端两顶点按照概率值进行加权平均,得到子集合C2中所有激活像素点所预测的文本框终止端两顶点的坐标c2_v2,c2_v3;
将子集合C1和子集合C2所得的顶点坐标合并,形成最终文本框的四个顶点坐标:c1_v1,c2_v2,c2_v3,c1_v4。
5.根据权利要求4所述的基于改进型EAST算法的文本检测方法,其特征在于:预测文本框顶点的加权平均算法如下:
xn代表子集合C1或子集合C2中第n个激活像素点所预测的顶点中x坐标值,yn代表子集合C1或子集合C2中第n个激活像素点所预测的顶点中y坐标值,Fn代表第n个激活像素点在map0上对应的概率值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建博思软件股份有限公司,未经福建博思软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910011376.5/1.html,转载请声明来源钻瓜专利网。