[发明专利]文本识别模型训练方法、文本定位方法及相关装置在审
申请号: | 202011011683.2 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112101354A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 华路延 | 申请(专利权)人: | 广州虎牙科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张欣欣 |
地址: | 511495 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 模型 训练 方法 定位 相关 装置 | ||
1.一种文本识别模型训练方法,其特征在于,所述方法包括:
获取预设数量的训练样本图像;每张所述样本图像具有文本信息;
将所述训练样本图像输入识别网络进行训练;
当所述训练的步长达到目标训练步长,将所述识别网络作为文本识别模型;所述目标训练步长用于指示所述识别网络即将处于收敛状态。
2.根据权利要求1所述的文本识别模型训练方法,其特征在于,还包括:
当所述训练的步长达到目标训练步长时,通过所述识别网络输出的识别结果具有模糊属性。
3.根据权利要求1所述的文本识别模型训练方法,其特征在于,所述获取预设数量的训练样本图像,包括:
获取预设数量的无文本图像;
对所述无文本图像添加所述文本信息,以获得所述训练样本图像。
4.根据权利要求3所述的文本识别模型训练方法,其特征在于,所述文本信息包含如下一种或组合:语种、文本格式、颜色格式、大小、文本内容;所述对所述无文本图像添加所述文本信息,以获得所述训练样本图像,包括:
将所述文本信息以任意排版角度添加至所述无文本图像的任意位置,生成所述训练样本图像。
5.一种文本定位方法,其特征在于,所述方法包括:
获取待处理图像;
将所述待处理图像输入文本识别模型中,输出目标图像;所述目标图像中存在具有模糊属性的区域;所述文本识别模型是识别网络的训练的步长达到目标训练步长时得到的文本识别模型;所述目标训练步长用于指示所述识别网络即将处于收敛状态;
根据所述目标图像定位所述待处理图像中的文本区域。
6.根据权利要求5所述的文本定位方法,其特征在于,所述根据所述目标图像定位所述待处理图像中的文本区域,包括:
根据目标区域获取待处理图像的差异区域;所述差异区域表征所述待处理图像中的文本区域和所述目标图像中的具有模糊属性的区域之间的差异;
基于所述差异区域定位所述待处理图像中的文本区域。
7.根据权利要求5所述的文本定位方法,其特征在于,在所述根据所述目标图像定位所述待处理图像中的文本区域之后,所述方法还包括:
获取所述待处理图像的二值图;
根据所述文本区域对所述二值图进行膨胀处理。
8.一种文本识别模型训练装置,其特征在于,包括:
获取模块,用于获取预设数量的训练样本图像;每张所述样本图像具有文本信息;
训练模块,用于将所述训练样本图像输入识别网络进行训练;
确定模块,用于当所述训练的步长达到目标训练步长,将所述识别网络作为文本识别模型;所述目标训练步长用于指示所述识别网络即将处于收敛状态。
9.一种文本定位装置,其特征在于,包括:
获取模块,用于获取待处理图像;
识别模块,用于将所述待处理图像输入文本识别模型中,输出目标图像;所述目标图像中存在具有模糊属性的区域;所述文本识别模型是识别网络的训练的步长达到目标训练步长时得到的文本识别模型;所述目标训练步长用于指示所述识别网络即将处于收敛状态;
定位模块,用于根据所述目标图像定位所述待处理图像中的文本区域。
10.一种电子设备,其特征在于,所述电子设备包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行指令,所述处理器在执行所述机器可执行指令时,该电子设备实现权利要求1-4中任意一项所述的文本识别模型训练方法或者实现权利要求5-7中任意一项所述的文本定位方法。
11.一种存储介质,其特征在于,所述存储介质中存储有机器可执行指令,所述机器可执行指令被执行时实现权利要求1-4中任意一项所述的文本识别模型训练方法或者实现权利要求5-7中任意一项所述的文本定位方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011011683.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于区块链的数据共享系统
- 下一篇:一种立式成缆方法