[发明专利]一种文本检测方法、计算设备及可读存储介质有效
申请号: | 202010269719.0 | 申请日: | 2020-04-08 |
公开(公告)号: | CN111582267B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 徐丞申;李林;叶明登;刘荣;黄萧 | 申请(专利权)人: | 北京皮尔布莱尼软件有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/82;G06N3/0464 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 计算 设备 可读 存储 介质 | ||
本发明公开了一种文本检测方法,适于在计算设备中执行,该方法包括步骤:获取待处理图像,待处理图像中包含文本信息,文本信息包含一行或多行文本;将待处理图像输入第一目标检测模型进行检测,获取包含文本信息的文本图像;将文本图像输入第二目标检测模型进行检测,获取包含单字信息的单字检测框;根据单字检测框的坐标对所有单字信息进行排序,获得完整的文本信息。本发明一并公开了相应的计算设备和可读存储介质。
技术领域
本发明涉及图像处理领域,尤其涉及一种文本检测方法、计算设备及可读存储介质。
背景技术
随着深度学习技术在检测识别上的发展,对于文本识别,一种典型的文本检测方法是目标检测识别(如Faster R-CNN,YoloV3等)与卷积神经网络(CRNN)进行序列识别相结合的方法,即先用目标检测识别算法检测识别出文字区域,再对文字区域用CRNN算法进行序列识别。由于CRNN算法需要大量数据才能将模型训练准确,因此,最近又有人提出了多次检测的算法,即第一步用检测识别算法检测出文字区域,第二步再用检测识别算法检测识别出单字,由于该方法是单字识别而非序列识别算法,因此在小数据上取得了很高的准确率,但是在实际应用中,有些识别项的行数是不固定的,可以包括多行。
目前对多行文本检测采用的方法为多次检测方案,将文本同一识别项中的不同的行标注为不同的类别,之后再对每一个区域进行单字识别,最后将结果拼接在一起,从而识别出完整的文本信息,由于同一个识别项的不同行标注成了不同的位置,使得检测识别算法中的标签类别数目与标签数增多,增加了内存使用量与计算的时间复杂度,降低了识别速度,另一方面由于多次检测的方法是针对于小数据集而提出的,对于包含多行文字信息的文字识别可能存在漏检的情况。
另外一种方法是将文本同一识别项的不同的行标注在同一个标注框中,之后再对该区域进行第二次标注,将不同行识别为不同类别,检测识别出单行,之后再对每一行进行单字识别,最后将结果拼接在一起,从而识别出完整的文字信息,该方案第一步检测出整体区域,第二步在此基础之上检测出单行,增加了一步检测识别程度,因此使得过程变得更加繁琐,速度也会有所下降。
发明内容
为此,本发明提供了一种文本检测方法、计算设备和可读存储介质,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种文本检测方法,适于在计算设备中执行,方法包括步骤:获取待处理图像,待处理图像中包含文本信息,文本信息包含一行或多行文本;将待处理图像输入第一目标检测模型进行检测,获取包含文本信息的文本图像;将文本图像输入第二目标检测模型进行检测,获取包含单字信息的单字检测框;根据单字检测框的坐标对所有单字信息进行排序,获得完整的文本信息。
可选地,在根据本发明的文本检测方法中,将待处理图像输入第一目标检测模型进行检测,获取包含文本信息的文本图像包括:将待处理图像输入第一检测模型检测出包含文本信息的文本区域;将文本区域进行剪切,输出包含文本信息的文本图像。
可选地,在根据本发明的文本检测方法中,第二检测模型还进一步输出单字。
可选地,在根据本发明的文本检测方法中,在根据单字检测框的坐标对所有单字信息进行排序,获得完整的文本信息步骤前还包括:对单字检测框进行文字识别,获得单字检测框包含的单字。
可选地,在根据本发明的文本检测方法中,根据单字检测框的坐标对所有单字信息进行排序,获得完整的文本信息包括:根据单字检测框左上顶点的横坐标,按照横坐标从左到右的顺序对所有单字检测框进行排序;计算单字检测框之间的交叠比,根据交叠比对所有单字检测框进行分组;获取每个分组中第一个单字检测框的左上顶点的纵坐标,并按照纵坐标从上到下的顺序对分组进行排序;将排序后的分组首尾相连,得到最终的文字信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京皮尔布莱尼软件有限公司,未经北京皮尔布莱尼软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269719.0/2.html,转载请声明来源钻瓜专利网。