[发明专利]文字校正的方法及装置、存储介质、处理器在审
申请号: | 201811474270.0 | 申请日: | 2018-12-04 |
公开(公告)号: | CN109583439A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 聂镭;沙露露;郑权;张峰;聂颖 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 江舟;董文倩 |
地址: | 519000 广东省珠*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校正 目标文字 词向量 目标处理 存储介质 文字识别 自动校正 处理器 向量 空格 归一化处理 技术效果 目标图片 网络获取 去重 预设 | ||
1.一种文字校正的方法,其特征在于,包括:
通过预设网络获取目标图片中待校正的目标文字的词向量,其中,每个所述词向量对应一个待校正的目标文字;
对所述词向量进行目标处理,获得处理后的词向量,其中,所述目标处理包括以下至少之一:去空格处理、去重处理、归一化处理;
将处理后的词向量对应的待校正的目标文字输入到训练好的模型中,得到校正后的目标文字。
2.根据权利要求1所述的方法,其特征在于,对所述词向量进行归一化处理包括:基于预设条件对所述词向量进行概率值归零处理。
3.根据权利要求1所述的方法,其特征在于,通过预设网络获取目标图片中待校正的目标文字的词向量包括:
通过卷积神经网络获取所述目标图片的特征矩阵,其中,所述目标图片包括所述待校正的目标文字;
将所述特征矩阵输入长短期记忆网络获取所述目标图片中待校正的目标文字的词向量。
4.根据权利要求2所述的方法,其特征在于,通过第一预设网络获取所述目标图片的特征矩阵之前,所述方法包括:
通过模板对所述目标标图进行预处理;
对预处理后的所述目标标图进行缩放,获得所述目标图片,其中,对预处理后的所述目标图像进行缩放时保持所述目标图片的宽度不变。
5.一种文字校正的装置,其特征在于,包括:
第一获取单元,用于通过预设网络获取目标图片中待校正的目标文字的词向量,其中,每个所述词向量对应一个待校正的目标文字;
第二获取单元,用于对所述词向量进行目标处理,获得处理后的词向量,其中,所述目标处理包括以下至少之一:去空格处理、去重处理、归一化处理;
校正单元,用于将归一化处理后的词向量对应的待校正的目标文字输入到训练好的模型中,得到校正后的目标文字。
6.根据权利要求5所述的装置,其特征在于,对所述词向量进行归一化处理包括:基于预设条件对所述词向量进行概率值归零处理。
7.根据权利要求5所述的装置,其特征在于,所述第一获取单元包括:
第一获取模块,用于通过卷积神经网络获取所述目标图片的特征矩阵,其中,所述目标图片包括所述待校正的目标文字;
第二获取模块,用于将所述特征矩阵输入长短期记忆网络获取所述目标图片中待校正的目标文字的词向量。
8.根据权利要求7所述的装置,其特征在于,所述装置包括:
处理单元,用于通过第一预设网络获取所述目标图片的特征矩阵之前,通过模板对所述目标标图进行预处理;
第三获取单元,用于对预处理后的所述目标标图进行缩放,获得所述目标图片,还用于对预处理后的所述目标图像进行缩放时保持所述目标图片的宽度不变。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至4中任一项所述文字校正的方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至4中任一项所述文字校正的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811474270.0/1.html,转载请声明来源钻瓜专利网。