[发明专利]一种文本识别方法、装置、电子设备、介质及产品在审
申请号: | 202111329026.7 | 申请日: | 2021-11-10 |
公开(公告)号: | CN113903036A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 刘珊珊;乔美娜;吴亮;章成全;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V20/40;G06V10/82;G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;孟维娜 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 识别 方法 装置 电子设备 介质 产品 | ||
1.一种文本识别方法,包括:
获取待识别图片;
基于所述待识别图片的长度确定滑窗,并利用所述滑窗对待识别图片进行裁剪,得到多个子图片,其中,所述滑窗的宽度与所述待识别图片的宽度相同,所述滑窗的长度小于所述待识别图片的长度,相邻的子图片之间存在重叠区域;
将各子图片分别输入预先训练的识别模型,得到所述识别模型对每个子图片的输出结果;
根据各子图片对应的输出结果,确定对所述待识别图片的文本识别结果。
2.根据权利要求1所述的方法,其中,子图片对应的输出结果包括子图片中的文字、每个文字的位置和置信度,所述根据各子图片对应的输出结果,确定对所述待识别图片的文本识别结果,包括:
按照每个子图片在所述待识别图片中的排列顺序,针对每个子图片,保留该子图片中非重叠区域的文本,并针对该子图片与相邻子图片的重叠区域,对比该重叠区域中相同位置的文字的置信度,保留置信度最高的文字,得到所述文本识别结果。
3.根据权利要求1所述的方法,在所述基于所述待识别图片的长度确定滑窗之前,所述方法还包括:
设置所述待识别图片的宽度为预设宽度;
确定所述待识别图片的长度所属的目标长度范围,并设置所述待识别图片的长度为所述目标长度范围的最小值。
4.根据权利要求1-3任一项所述的方法,其中,所述获取待识别图片,包括:
获取初始图片;
将所述初始图片输入预先训练的检测模型,得到所述检测模型输出的多个检测框,每个检测框内包括文字;
确定所述初始图片的第一中心线,所述第一中心线与所述初始图片的底边平行;
分别计算每个检测框的第二中心线与所述第一中心线之间的距离,将第二中心线与所述第一中心线之间的距离小于预设距离的检测框作为候选框,每个检测框的第二中心线与自身的底边平行;
将各候选框合并,并计算合并后的候选框的最小外接矩形,得到待检测框;
在所述初始图片中按照所述待检测框进行裁剪,得到所述待识别图片。
5.根据权利要求4所述的方法,在所述将所述初始图片输入预先训练的检测模型之前,所述方法还包括:
判断所述初始图片的长度是否大于等于指定长度;
若是,则将所述初始图片的长度设置为第一长度,所述第一长度小于指定长度;
若否,则将所述初始图片的长度设置为第二长度,所述第二长度小于第一长度;
按照预设的长宽比,根据所述初始图片的长度,设置所述初始图片的宽度。
6.一种文本识别装置,包括:
获取模块,用于获取待识别图片;
裁剪模块,用于基于所述获取模块获取的所述待识别图片的长度确定滑窗,并利用所述滑窗对待识别图片进行裁剪,得到多个子图片,其中,所述滑窗的宽度与所述待识别图片的宽度相同,所述滑窗的长度小于所述待识别图片的长度,相邻的子图片之间存在重叠区域;
输入模块,用于将所述裁剪模块裁剪的各子图片分别输入预先训练的识别模型,得到所述识别模型对每个子图片的输出结果;
确定模块,用于根据各子图片对应的输出结果,确定对所述待识别图片的文本识别结果。
7.根据权利要求6所述的装置,其中,子图片对应的输出结果包括子图片中的文字、每个文字的位置和置信度,所述确定模块,具体用于:
按照每个子图片在所述待识别图片中的排列顺序,针对每个子图片,保留该子图片中非重叠区域的文本,并针对该子图片与相邻子图片的重叠区域,对比该重叠区域中相同位置的文字的置信度,保留置信度最高的文字,得到所述文本识别结果。
8.根据权利要求6所述的装置,所述装置还包括:设置模块;
所述设置模块,用于在所述基于所述待识别图片的长度确定滑窗之前,设置所述待识别图片的宽度为预设宽度;
所述设置模块,还用于确定所述待识别图片的长度所属的目标长度范围,并设置所述待识别图片的长度为所述目标长度范围的最小值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111329026.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种伸缩式易携带混凝土搅拌设备
- 下一篇:一种超柔软铅笔笔芯及其制备方法