[发明专利]字符检测模型的生成、字符检测方法、装置、设备及介质有效
申请号: | 201910027515.3 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109766879B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 卢永晨 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100080 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 检测 模型 生成 方法 装置 设备 介质 | ||
1.一种字符检测模型的生成方法,其特征在于,包括:
将至少一个字符图像拼接成至少一个字符行图像,所述字符图像为与小语种语言对应的单个字符的图像;
根据所述至少一个字符行图像和空白背景图片构造至少一张待识别文字图片,包括:将所述至少一个字符行图像按照预设定位信息添加至空白背景图片上,构造出至少一张待识别文字图片,其中,所述定位信息包括位置信息和旋转角度信息;
获取所述至少一张待识别文字图片中各字符图像的定位信息;
将所述待识别文字图片以及所述待识别文字图片中各字符图像的定位信息对应作为一组字符检测训练样本数据;
采用至少一组字符检测训练样本数据以及标准字符检测训练样本集,对原始机器学习模型进行训练,生成字符检测模型,所述字符检测模型用于检测待识别文字图片中的各字符图像的定位信息,所述标准字符检测训练样本集为现有的、用于训练所述字符检测模型能够成功检测出待识别图片中大语种字符图像定位信息的训练样本。
2.根据权利要求1所述的方法,其特征在于,在所述将所述待识别文字图片以及所述待识别文字图片中各字符图像的定位信息对应作为一组字符检测训练样本数据之前,还包括:
对所述待识别文字图片添加噪声。
3.根据权利要求1所述的方法,其特征在于,所述小语种字符包括印地语字符。
4.一种字符检测方法,其特征在于,包括:
获取待识别文字图片;
将所述待识别文字图片输入至通过如权利要求1-3任一项所述的方法生成的字符检测模型;
获取所述字符检测模型输出的所述待识别文字图片中各字符图像的定位信息。
5.根据权利要求4所述的方法,其特征在于,
所述定位信息包括位置信息和旋转角度信息,所述小语种字符包括印地语字符。
6.一种字符检测模型的生成装置,其特征在于,包括:
待识别文字图片构造模块,用于根据至少一个字符图像和空白背景图片构造至少一张待识别文字图片,所述字符图像为与小语种语言对应的单个字符的图像;
定位信息获取模块,用于获取所述至少一张待识别文字图片中各字符图像的定位信息;
训练样本数据生成模块,用于将所述待识别文字图片以及所述待识别文字图片中各字符图像的定位信息对应作为一组字符检测训练样本数据;
模型训练模块,用于采用至少一组字符检测训练样本数据以及标准字符检测训练样本集,对原始机器学习模型进行训练,生成字符检测模型,所述字符检测模型用于检测待识别文字图片中的各字符图像的定位信息,所述标准字符检测训练样本集为现有的、用于训练所述字符检测模型能够成功检测出待识别图片中大语种字符图像定位信息的训练样本;
其中,所述待识别文字图片构造模块包括:字符行图像构造单元和待识别文字图片构造单元,其中,
所述字符行图像构造单元,用于将至少一个字符图像拼接成至少一个字符行图像;
所述待识别文字图片构造单元,用于根据所述至少一个字符行图像和空白背景图片构造至少一张待识别文字图片,具体用于将所述至少一个字符行图像按照预设定位信息添加至所述空白背景图片上,构造出至少一张待识别文字图片;
其中,所述定位信息包括位置信息和旋转角度信息。
7.根据权利要求6所述的装置,其特征在于,还包括:图片处理模块,用于在将所述待识别文字图片以及所述待识别文字图片中各字符图像的定位信息对应作为一组字符检测训练样本数据之前,对所述待识别文字图片添加噪声。
8.根据权利要求6所述的装置,其特征在于,所述小语种字符包括印地语字符。
9.一种字符检测装置,其特征在于,包括:
待识别文字图片获取模块,用于获取待识别文字图片;
检测模块,用于将所述待识别文字图片输入至通过如权利要求6-8任一项所述的装置生成的字符检测模型;
检测结果获取模块,用于获取所述字符检测模型输出的所述待识别文字图片中各字符图像的定位信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910027515.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车道线检测的方法和设备
- 下一篇:手持式输入系统