[发明专利]一种文字定位方法、装置及设备有效
申请号: | 202010692775.5 | 申请日: | 2020-07-17 |
公开(公告)号: | CN111881916B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 卢健 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/40 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 周达;刘飞 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 定位 方法 装置 设备 | ||
1.一种文字定位方法,其特征在于,应用于服务器,包括:
获取包括文字的原始图像;
基于所述原始图像生成多个中间图像;其中,所述中间图像包括表示预计文字区域的颜色和表示预计背景区域的颜色;所述多个中间图像的预计文字区域的面积不同;
分别对应所述多个中间图像生成多个二值矩阵;其中,以预计文字区域的面积最小的中间图像对应的二值矩阵作为基准矩阵,以除预计文字区域的面积最小的中间图像之外的中间图像对应的二值矩阵作为约束矩阵;其中,与中间图像对应的二值矩阵中,对应所述预计文字区域的元素为第一取值,以及对应所述预计背景区域的元素为第二取值;
以中间图像的预计文字区域的面积顺次增大的顺序,选择约束矩阵,对所述基准矩阵中第一取值的元素的数量进行扩展处理,得到目标二值矩阵;其中,所述目标二值矩阵中第一取值的元素对应的所述原始图像中的区域为文字区域。
2.根据权利要求1所述的方法,其特征在于,所述对所述基准矩阵中第一取值的元素的数量进行扩展处理,包括:
确定所述基准矩阵中对应预计文字区域的外边界的第一位置信息;
基于所述第一位置信息执行下述扩展步骤:获取选择的约束矩阵中所述第一位置信息所对应的元素的取值;在获取的取值中存在第一取值的情况下,根据所述获取的取值对所述基准矩阵中第一取值的元素的数量进行扩展处理。
3.根据权利要求2所述的方法,其特征在于,所述对所述基准矩阵中第一取值的元素的数量进行扩展处理,包括:
确定所述获取的取值中第一取值的元素所对应的第二位置信息;
将所述基准矩阵中第二位置信息所对应的元素的取值更新为第一取值,获得扩展后的基准矩阵。
4.根据权利要求2所述的方法,其特征在于,所述对所述基准矩阵中第一取值的元素的数量进行扩展处理,包括:
将所述基准矩阵中所述第一位置信息所对应的元素的取值更新为所述获取的取值中相应第一位置信息所对应的元素的取值。
5.根据权利要求2所述的方法,其特征在于,所述确定所述基准矩阵中对应预计文字区域的外边界的第一位置信息,包括:
以所述基准矩阵的维度范围为限制,将所述基准矩阵中第一取值的元素的位置分别向四周平移一个元素单位;
将平移后的基准矩阵与平移前的基准矩阵进行矩阵运算,得到边界矩阵;
将所述边界矩阵中第一取值的元素的位置信息作为所述基准矩阵中对应预计文字区域的外边界的第一位置信息。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将扩展后的基准矩阵代替所述基准矩阵,重复上述扩展步骤,直至所述选择的约束矩阵中所述第一位置信息所对应的元素的取值中不存在第一取值。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在所述选择的约束矩阵中所述第一位置信息所对应的元素的取值中不存在第一取值情况下,获取所述选择的约束矩阵的下一个约束矩阵,对在所述选择的约束矩阵约束下最后一次扩展后的基准矩阵重复第一位置信息确定以及扩展步骤,直至不存在约束矩阵,得到目标二值矩阵。
8.根据权利要求1所述的方法,其特征在于,所述对所述基准矩阵中第一取值的元素的数量进行扩展处理,包括:
利用pytorch工具,调用GPU资源并行对所述基准矩阵中第一取值的元素的数量进行扩展处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010692775.5/1.html,转载请声明来源钻瓜专利网。