[发明专利]文本识别方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202010226050.7 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111428717A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 李月;黄光伟;史新艳 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 李娜 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请提供了一种文本识别方法、装置、电子设备及计算机可读存储介质。所述方法包括:获取包含文本信息的待识别图片;通过预先训练好的文本检测模型对所述待识别图片进行识别,确定所述待识别图片中包含文本的至少一个文本框,及各所述文本框对应的倾斜方向;根据所述倾斜方向对各所述文本框的文本方向进行校正,得到所述文本方向校正后的校正文本框;识别所述校正文本框中的文本信息。本申请实施例可以提高识别文字内容的方向的精确度,提高图片文本识别的准确性。
技术领域
本申请涉及图片处理技术领域,特别是涉及一种文本识别方法、装置、电子设备及计算机可读存储介质。
背景技术
对图片中文本内容进行识别时,需要先用文本检测方法对图片中所有文本框进行检测,然后将得到的每个文本框旋转至水平,最后将每个文本框图片(文字方向为水平正向)送入到识别模型中进行文本框内文字的识别。
一种文本检测方法,可以得到图片中文本框的位置信息(中心点坐标、宽高和角度),但是无法反应出文字的真实朝向。如图1所示,文本框的形状与方向是一致的,但是框内文字的方向差异非常大。这带来的问题是,对每个文本框旋转时可能会出现文字方向旋转错误的情况,如图2所示,这将导致文本内容识别错误。
发明内容
本申请提供一种文本识别方法、装置、电子设备及计算机可读存储介质,以解决无法识别出文字真实朝向容易导致文本内容识别错误的问题。
为了解决上述问题,本申请公开了一种文本识别方法,包括:
获取包含文本信息的待识别图片;
通过预先训练好的文本检测模型对所述待识别图片进行识别处理,确定所述待识别图片中包含文本的至少一个文本框,及各所述文本框对应的倾斜方向;
根据所述倾斜方向对各所述文本框的文本方向进行校正处理,得到所述文本方向校正后的校正文本框;
识别所述校正文本框中的文本信息。
可选地,在所述获取包含文本信息的待识别图片之前,还包括:
确定预先训练的所述文本检测模型;
所述确定预先训练的所述文本检测模型,包括:
获取样本图片;所述样本图片中包含有预先标注的至少一个初始文本框,及各所述初始文本框在所述样本图片中所处的初始位置信息、各所述初始文本框的初始倾斜方向;
将所述样本图片依次输入至初始文本检测模型对所述初始文本检测模型进行训练,确定所述样本图片对应的至少一个预测文本框,及各所述预测文本框在所述样本图片中所处的预测位置信息、各所述预测文本框的预测倾斜方向;
根据各所述初始位置信息、各所述预测位置信息、各所述初始倾斜方向和各所述预测倾斜方向,计算得到所述初始文本检测模型的损失值;
在所述损失值处于预设范围内的情况下,将训练后的初始文本检测模型作为所述文本检测模型。
可选地,所述根据各所述初始位置信息、各所述预测位置信息、各所述初始倾斜方向和各所述预测倾斜方向,计算得到所述初始文本检测模型的损失值,包括:
根据各所述初始位置信息和各所述预测位置信息,计算得到位置损失值;
根据各所述初始倾斜方向和各所述预测倾斜方向,计算得到倾斜损失值;
根据所述位置损失值、位置权重、所述倾斜损失值和倾斜权重,计算得到所述初始文本检测模型的损失值。
可选地,所述文本检测模型包括:分类结果获取层和倾斜方向获取层,所述通过预先训练的文本检测模型对所述待识别图片进行识别,确定所述待识别图片中包含文本的至少一个文本框,及各所述文本框对应的倾斜方向,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010226050.7/2.html,转载请声明来源钻瓜专利网。