[发明专利]一种文本识别方法、模型训练方法、装置及设备在审
申请号: | 202010760060.9 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111914840A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 谢小容;张晓丹;孙歌睿 | 申请(专利权)人: | 中国建设银行股份有限公司;建信金融科技有限责任公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 周达;刘飞 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 识别 方法 模型 训练 装置 设备 | ||
本说明书实施例提供一种文本识别方法、模型训练方法、装置及设备。所述方法包括:接收待处理图像;所述待处理图像中包含有待识别文本;获取所述待处理图像对应的图像模板类别;在所述待处理图像中截取出对应于所述图像模板类别的待处理模板图像;确定对应于所述待处理模板图像的倾斜角度;基于所述倾斜角度对所述待处理模板图像中的待识别文本进行识别。通过上述方法,通过确定对应于一定图像模板类别的待处理模板图像,进而识别出待处理模板图像的倾斜角度,从而能够基于倾斜角度对图像进行矫正并进一步实现图像中的文本的识别,解决了无法准确识别倾斜图像中的文本的问题。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种文本识别方法、模型训练方法、装置及设备。
背景技术
随着科技的进步和社会的发展,在工作和生活中越来越多地利用到对图像中的文字进行识别。对图像中的文字进行识别时,首先获取图像中的字符,并基于所识别的字符构建完整的字段。
但是,在实际应用中,所获取到的图像可能是具有一定倾斜角度的倾斜图像,直接对倾斜图像中的文字进行识别不仅在字符识别上具有一定的难度,也可能无法根据倾斜的文本构建正确的段落,从而无法对图像中的文本进行准确识别。因此,目前亟需一种能够对倾斜图像中的文本进行识别的技术方案。
发明内容
本说明书实施例的目的是提供一种文本识别方法、模型训练方法、装置及设备,以解决如何对倾斜图像中的文本进行识别的问题。
为解决上述技术问题,本申请实施例还提供一种图像识别模型训练方法,包括:
接收第一样本图像;所述第一样本图像对应有图像模板类别;所述样本图像中标注有至少一个第一定位字符;
获取所述第一定位字符在所述第一样本图像中的字符位置;
基于所述字符位置和所述图像模块类别训练预先构建的图像识别模型;所述图像识别模型,用于识别图像所对应的图像模板类别。
本说明书实施例还提出一种图像识别模型训练装置,包括:
第一样本图像接收模块,用于接收第一样本图像;所述第一样本图像对应有图像模板类别;所述样本图像中标注有至少一个第一定位字符;
字符位置获取模块,用于获取所述第一定位字符在所述第一样本图像中的字符位置;
图像识别模型训练模块,用于基于所述字符位置和所述图像模块类别训练预先构建的图像识别模型;所述图像识别模型,用于识别图像所对应的图像模板类别。
本说明书实施例还提出一种图像识别模型训练设备,包括存储器和处理器;所述存储器,存储有计算机程序指令;所述处理器,用于执行所述计算机程序指令以实现以下步骤:接收第一样本图像;所述第一样本图像对应有图像模板类别;所述样本图像中标注有至少一个第一定位字符;获取所述第一定位字符在所述第一样本图像中的字符位置;基于所述字符位置和所述图像模块类别训练预先构建的图像识别模型;所述图像识别模型,用于识别图像所对应的图像模板类别。
为了解决上述技术问题,本说明书实施例还提出一种角度识别模型训练方法,包括:
接收第二样本图像;所述第二样本图像对应有旋转角度;所述第二样本图像对应有图像模板类别;
基于所述图像模板类别和所述旋转角度训练预先构建的角度识别模型;所述角度识别模型,用于识别图像的倾斜角度。
本说明书实施例还提出一种角度识别模型训练装置,包括:
第二样本图像接收模块,用于接收第二样本图像;所述第二样本图像对应有旋转角度;所述第二样本图像对应有图像模板类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010760060.9/2.html,转载请声明来源钻瓜专利网。