[发明专利]一种文本检测方法、计算设备及可读存储介质有效
申请号: | 202010269719.0 | 申请日: | 2020-04-08 |
公开(公告)号: | CN111582267B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 徐丞申;李林;叶明登;刘荣;黄萧 | 申请(专利权)人: | 北京皮尔布莱尼软件有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/82;G06N3/0464 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 计算 设备 可读 存储 介质 | ||
1.一种文本检测方法,适于在计算设备中执行,所述方法包括步骤:
获取待处理图像,所述待处理图像中包含文本信息,所述文本信息包含一行或多行文本;
将所述待处理图像输入第一目标检测模型进行检测,获取包含所述文本信息的文本图像;
将所述文本图像输入第二目标检测模型进行检测,获取包含单字信息的单字检测框;
根据所述单字检测框左上顶点的横坐标,按照横坐标从左到右的顺序对所有单字检测框进行排序;
计算单字检测框之间的交叠比,根据所述交叠比对所有单字检测框进行分组;
获取每个分组中第一个单字检测框的左上顶点的纵坐标,并按照纵坐标从上到下的顺序对分组进行排序;
将排序后的分组首尾相连,得到最终的文字信息;
其中,所述计算单字检测框之间的交叠比,根据所述交叠比对所有单字检测框进行分组包括:
获取待检测单字检测框;
计算所述待检测单字检测框与已有分组中的最后一个单字检测框的交叠比;
将交叠比大于预定数值的单字检测框分到同一分组;
若待检测单字检测框与所有已有分组中的最后一个单字检测框的交叠比均不大于预定数值,则增加新的分组。
2.如权利要求1所述的方法,其中,所述将所述待处理图像输入第一目标检测模型进行检测,获取包含所述文本信息的文本图像包括:
将所述待处理图像输入所述第一目标检测模型检测出包含所述文本信息的文本区域;
将所述文本区域进行剪切,输出包含所述文本信息的文本图像。
3.如权利要求1或2所述的方法,其中,所述第二目标检测模型还进一步输出单字。
4.如权利要求1或2所述的方法,其中,在所述根据所述单字检测框的坐标对所有单字信息进行排序,获得完整的文本信息步骤前还包括:
对单字检测框进行文字识别,获得所述单字检测框包含的单字。
5.如权利要求1所述的方法,其中,所述计算所述待检测单字检测框与已有分组中的最后一个单字检测框的交叠比包括:
获取所述待检测单字检测框与已有分组中的最后一个单字检测框的左上顶点坐标和右下顶点坐标;
按照以下公式计算待检测单字检测框与已有分组中的最后一个单字检测框的交叠比r:
其中,所述待检测单字检测框的左上点坐标为(x11,y11),所述待检测单字检测框的右下点坐标为(x12,y12),所述分组中最后一个单字检测框的左上点坐标为(x21,y21),所述分组中最后一个单字检测框的右下点坐标为(x22,y22),且x11x12,y11y12。
6.如权利要求1或2所述的方法,其中,所述第一目标检测模型和第二目标检测模型为卷积神经网络Faster R-CNN。
7.如权利要求1或2所述的方法,其中,所述待处理图像为身份证图像,所述文本信息为地址信息。
8.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-7中任一项所述方法的指令。
9.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-7中任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京皮尔布莱尼软件有限公司,未经北京皮尔布莱尼软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269719.0/1.html,转载请声明来源钻瓜专利网。