[发明专利]文本字符的识别方法、装置和服务器在审
申请号: | 202110300713.X | 申请日: | 2021-03-22 |
公开(公告)号: | CN112883956A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 陈思念;杨兴业;石雪;张宇鸿 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;王涛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 字符 识别 方法 装置 服务器 | ||
1.一种文本字符的识别方法,其特征在于,包括:
获取待处理的目标图像;其中,所述目标图像包含有待识别的目标文本字符;
调用预设的字符识别模型处理所述目标图像,得到对应的处理结果;其中,所述预设的字符识别模型至少包括:低层卷积网络层、高层卷积网络层,以及fire模块,且在低层卷积网络层与所述高层卷积网络层之间还设置有跨层连接;
根据所述处理结果,确定出所述目标文本字符。
2.根据权利要求1所述的方法,其特征在于,所述低层卷积网络层包括:第一卷积层、第二卷积层和第三卷积层;所述高层卷积网络层包括:第四卷积层和第五卷积层;所述fire模块包括第一fire模块和第二fire模块。
3.根据权利要求2所述的方法,其特征在于,所述第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层按序依次串联;且在所述第四卷积层和第五卷积层之间还依次串联有第一fire模块和第二fire模块。
4.根据权利要求3所述的方法,其特征在于,在所述第三卷积层与所述第五卷积层之间设置有跨层连接;和/或,在所述第一卷积层与所述第四卷积层之间设置有跨层连接。
5.根据权利要求4所述的方法,其特征在于,在获取待处理的目标图像之前,所述方法还包括:
构建初始模型;其中,所述初始模型至少包含有初始的低层卷积网络层、初始的高层卷积网络层,以及初始的fire模块,且在初始的低层卷积网络层与所述初始的高层卷积网络层之间还设置有跨层连接;
获取样本图像;其中,所述样本图像包含有存在重叠的文本字符;
根据所述样本图像,建立训练集和测试集;并对训练集中的样本图像进行标注,得到标注后的训练集;
利用所述标注后的训练集和所述测试集,训练所述初始模型,得到符合要求的预设的字符识别模型。
6.根据权利要求5所述的方法,其特征在于,获取样本图像,包括:
采集包含有文本字符的第一图片数据;
对所述第一图片数据进行扩充处理,得到第二图片数据;
根据文本字符,分割所述第二图片数据,得到多个第三图片数据;
从所述多个第三图片数据中筛选出包含有存在重叠的文本字符的样本图像。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
确定出特征的感受野范围;
根据所述特征的感受野范围,调整初始的低层卷积网络层、初始的高层卷积网络层所使用的卷积核的尺寸参数。
8.根据权利要求5所述的方法,其特征在于,在获取样本图像之后,所述方法还包括:
根据所述样本图像,计算出样本图像的平均值和方差;
根据所述样本图像的平均值和方差,对所述样本图像进行批标准化处理。
9.根据权利要求1所述的方法,其特征在于,所述目标图像包括以下至少之一:包含有票据的图片、包含有证件的图片、包含有合同的图片。
10.一种文本字符的识别方法,其特征在于,包括:
获取待处理的目标图像;其中,所述目标图像包含有待识别的目标文本字符;
调用预设的字符识别模型处理所述目标图像,得到对应的处理结果;其中,所述预设的字符识别模型至少包括:低层卷积网络层、高层卷积网络层,以及fire模块;
根据所述处理结果,确定出所述目标文本字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110300713.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于治疗角膜炎的清泻消障方剂
- 下一篇:一种电梯安全钳操纵机构