[发明专利]一种弯曲文字矫正方法、存储介质和电子装置有效
申请号: | 202110499309.X | 申请日: | 2021-05-08 |
公开(公告)号: | CN113139545B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 孔令军;王锐;周耀威;姜哲鹏;闫佳艺 | 申请(专利权)人: | 金陵科技学院 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V10/82;G06N3/0464 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 梅学兵 |
地址: | 211112 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 弯曲 文字 矫正 方法 存储 介质 电子 装置 | ||
本发明提供一种弯曲文字矫正方法、存储介质和电子装置,其中方法包括获取包含成行文字的图片;利用文字中线识别模型对图片进行识别,得到文字中线热点图;将文字中线热点图还原为组成文字中线的点,具体是对于每个热点,将其与周围热点进行比较,取热点值最大的热点;判断热点值最大的热点位于文字中线的概率是否大于预设的第一阈值,如是则保留该热点,否则丢弃,从而得到组成文字中线的点集;对点集进行聚类和矫正文字。本发明通过构造文字中线识别模型,生成每行文字中线的热点图,进一步将文字归类到所属的行,然后矫正。本发明的识别弯曲文字以及对其矫正的方法利用深度卷积网络实现,简化了识别过程,智能程度高,准确率得到很大提升。
技术领域
本发明涉及图像处理技术领域,特别涉及一种弯曲文字矫正方法、存储介质和电子装置。
背景技术
随着拍照技术和图像识别技术的不断发展,利用智能终端拍照接着进行人工智能处理,从而识别图片中文字的做法越来越普遍。在很多情况中,由于拍摄角度的问题,摄像头不会恰好位于所拍摄文字的正上方,而是与垂直方向有夹角,从而拍摄得到的图片是倾斜的,图片中的整行文字并不是直线排列,而是弯曲成一定弧度的。这样的图片再做进一步机器识别或处理,就容易出现错行或识别不出文字。
解决这一问题需要将图片中弯曲的整行文字矫正为沿直线排列,目前现有技术中是通过识别图片中单个字符的基础上再判断与相邻文字的关系,确认其所在的行,再对整行文字进行矫正。这种方法智能程度低,算法复杂且矫正的准确度不高,不能适应人们对图像处理智能化的要求。
发明内容
鉴于以上问题,本发明提供一种弯曲文字矫正方法、存储介质和电子装置,采用新的算法,通过对文字中线的识别矫正图片中的弯曲文字。
本发明采用以下技术方案实现上述目的。
第一方面,本发明提供一种弯曲文字矫正方法,包括以下步骤,获取包含成行文字的图片;利用文字中线识别模型对所述图片进行识别,得到文字中线热点图;将所述文字中线热点图还原为组成文字中线的点,具体为:遍历所述文字中线热点图中的点,对于每个热点,将其与周围热点进行比较,取热点值最大的热点;判断所述热点值最大的热点位于文字中线的概率是否大于预设的第一阈值,如是则保留该热点,否则丢弃,从而得到组成文字中线的点集;对所述点集进行聚类,具体为合并距离小于第二阈值的所述点集,直到所述点集之间的距离大于所述第二阈值;矫正文字,具体为:对每组点集用曲线拟合,沿所述曲线对图片进行切片,再对所述切片进行直线合并,得到沿直线排列的整行文字。
进一步的,所述文字中线识别模型由以下步骤得到,
S21、人工标记图片中每行文字的中线,并将该中线通过高斯变换转换成第一热点图;
S22、利用深度卷积网络对原始图片进行预测得到第二热点图;
S23、将所述第一热点图和所述第二热点图进行训练,直到损失函数收敛为止,得到所述文字中线识别模型;所述损失函数表示所述第一热点图的预测量和所述第二热点图预测量之间的误差。
进一步,S22中所述利用深度卷积网络对原始图片进行预测得到第二热点图具体为:所述原始图片经过深度卷积网络的卷积层提取特征值、池化层降低分辨率后,得到特征矩阵,再经过激活函数激活,将特征点的值归一化到0~1之间,即得到所述第二热点图。
进一步的,所述损失函数为
其中,l、w、h分别表示热点图的通道维度、宽和高,j、x、y表示热点图上点的坐标,表示第二热点图的预测量,表示第一热点图的预测量。
进一步的,所述激活函数为
其中,x表示第二热点图中某个热点的热点值。
进一步的,所述切片的宽度为一个像素点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金陵科技学院,未经金陵科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110499309.X/2.html,转载请声明来源钻瓜专利网。