[发明专利]识别手写汉字的方法、系统及设备在审
申请号: | 201711459778.9 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108364037A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 武晨 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/62;G06N3/04 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 梁风霞 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写汉字 文本识别 系统及设备 初始模型 信息图片 样本集 人力资本 手写文本 训练样本 准确率 打字 样本 场景 移植 图片 创建 优化 | ||
1.识别手写汉字的方法,其特征在于,包括以下步骤:
S1,从待识别图片中提取手写汉字区域,再从所述手写汉字区域中提取出若干张信息图片;
S2,以步骤S1中所述的信息图片为样本,创建手写汉字识别的样本集;
S3,建立手写汉字文本识别初始模型;
S4,以步骤S2中所述的样本集为基础,对所述手写汉字文本识别初始模型进行优化,得到手写汉字文本识别模型;
S5,利用所述手写汉字文本识别模型,对待识别图片进行识别。
2.根据权利要求1所述的识别手写汉字的方法,其特征在于,步骤S1中所述的待识别图片为运单图片。
3.根据权利要求2所述的识别手写汉字的方法,其特征在于,所述步骤S1包括步骤:
S11,获取运单图片;
S12,调整所述运单图片,使所述运单图片的底边与水平线的偏差角度在预设的误差范围内;
S13,将步骤S12中调整过的运单图片与空白运单图片进行对比、抵消,获得运单图片中的填写内容;
S14,以所述运单图片左侧边沿为初始边截取整张运单图片的40%-75%的区域作为有效信息区域,获取有效信息区域的图片;
S15,从所述有效信息区域的图片中提取若干张信息图片。
4.根据权利要求1所述的识别手写汉字的方法,其特征在于,所述步骤S2包括步骤:
S21,对步骤S1中全部的信息图片进行命名,每一张所述信息图片对应唯一命名;
S22,将每张所述信息图片的文字序列作为该张图片的标签;
S23,将全部的标签按照顺序保存在文本文件中,每个所述标签按预设格式设置;
S24,以所述信息图片及其标签作为样本,创建手写汉字识别的样本集。
5.根据权利要求1所述识别手写汉字的方法,其特征在于,所述步骤S3包括步骤:
S31,将步骤S2中所述的样本集平均分为若干个样本子集;
S32,对所述样本子集中的每张信息图片进行路径扫描与LSTM处理得到对应子集;
S33,对所述对应子集中的每张图片进行卷积与求和处理,得到第一特征图像;
S34,将同一张信息图片所产生的第一特征图像分别依次进行路径扫描与LSTM处理、卷积与求和处理得到第二特征图像;
S35,将同一张信息图片所产生的第二特征图像分别依次进行路径扫描与LSTM处理,得到中间图像子集;
S36,将所述中间图像子集经过全连接层建立参数矩阵,然后将相关的参数矩阵相加求和,最终得到每张信息图片的全连接层数据;
S37,对每个全连接层数据进行参数归一化处理,得到归一化的参数矩阵;
S38,对每个归一化的参数矩阵经过CTC分类器,得到特征向量;
S39,将全部的样本子集均进行S32-S38的处理,将获得的结果与真实的结果进行比较并迭代进行全网络参数的优化。
6.根据权利要求5所述的识别手写汉字的方法,其特征在于,所述的路径扫描与LSTM处理包括步骤:
对每张图片进行四种路径扫描,每张图片得到四张顺序信息的扫描图片;
将每张所述扫描图片经过一层含有N核的LSTM层,分别得到N张对应图片。
7.根据权利要求5所述的识别手写汉字的方法,其特征在于,所述的卷积与求和处理包括步骤:
每张图片经过一个包含有M个卷积核的卷积层过滤得到特征矩阵,同一张信息图片所对应的图片的特征矩阵为相关特征矩阵,将所述相关特征矩阵进行求和并进行非线性运算获得特征图像。
8.根据权利要求1所述的识别手写汉字的方法,其特征在于,所述步骤S4包括:
S41,将步骤2中所述的样本集按照比例分为训练集,测试集和验证集;
S42,基于获得按照预定比例设置的训练集、测试集和验证集,采用梯度下降法优化所述手写汉字文本初始识别模型的参数,并基于GPU加速器迭代进行模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711459778.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建模方法、识别方法、装置、存储介质及设备
- 下一篇:手推式发卡装置