[发明专利]识别手写汉字的方法、系统及设备在审

专利信息
申请号: 201711459778.9 申请日: 2017-12-28
公开(公告)号: CN108364037A 公开(公告)日: 2018-08-03
发明(设计)人: 武晨 申请(专利权)人: 顺丰科技有限公司
主分类号: G06K9/68 分类号: G06K9/68;G06K9/62;G06N3/04
代理公司: 北京志霖恒远知识产权代理事务所(普通合伙) 11435 代理人: 梁风霞
地址: 518061 广东省深圳市南山区学府路(以南)*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 手写汉字 文本识别 系统及设备 初始模型 信息图片 样本集 人力资本 手写文本 训练样本 准确率 打字 样本 场景 移植 图片 创建 优化
【权利要求书】:

1.识别手写汉字的方法,其特征在于,包括以下步骤:

S1,从待识别图片中提取手写汉字区域,再从所述手写汉字区域中提取出若干张信息图片;

S2,以步骤S1中所述的信息图片为样本,创建手写汉字识别的样本集;

S3,建立手写汉字文本识别初始模型;

S4,以步骤S2中所述的样本集为基础,对所述手写汉字文本识别初始模型进行优化,得到手写汉字文本识别模型;

S5,利用所述手写汉字文本识别模型,对待识别图片进行识别。

2.根据权利要求1所述的识别手写汉字的方法,其特征在于,步骤S1中所述的待识别图片为运单图片。

3.根据权利要求2所述的识别手写汉字的方法,其特征在于,所述步骤S1包括步骤:

S11,获取运单图片;

S12,调整所述运单图片,使所述运单图片的底边与水平线的偏差角度在预设的误差范围内;

S13,将步骤S12中调整过的运单图片与空白运单图片进行对比、抵消,获得运单图片中的填写内容;

S14,以所述运单图片左侧边沿为初始边截取整张运单图片的40%-75%的区域作为有效信息区域,获取有效信息区域的图片;

S15,从所述有效信息区域的图片中提取若干张信息图片。

4.根据权利要求1所述的识别手写汉字的方法,其特征在于,所述步骤S2包括步骤:

S21,对步骤S1中全部的信息图片进行命名,每一张所述信息图片对应唯一命名;

S22,将每张所述信息图片的文字序列作为该张图片的标签;

S23,将全部的标签按照顺序保存在文本文件中,每个所述标签按预设格式设置;

S24,以所述信息图片及其标签作为样本,创建手写汉字识别的样本集。

5.根据权利要求1所述识别手写汉字的方法,其特征在于,所述步骤S3包括步骤:

S31,将步骤S2中所述的样本集平均分为若干个样本子集;

S32,对所述样本子集中的每张信息图片进行路径扫描与LSTM处理得到对应子集;

S33,对所述对应子集中的每张图片进行卷积与求和处理,得到第一特征图像;

S34,将同一张信息图片所产生的第一特征图像分别依次进行路径扫描与LSTM处理、卷积与求和处理得到第二特征图像;

S35,将同一张信息图片所产生的第二特征图像分别依次进行路径扫描与LSTM处理,得到中间图像子集;

S36,将所述中间图像子集经过全连接层建立参数矩阵,然后将相关的参数矩阵相加求和,最终得到每张信息图片的全连接层数据;

S37,对每个全连接层数据进行参数归一化处理,得到归一化的参数矩阵;

S38,对每个归一化的参数矩阵经过CTC分类器,得到特征向量;

S39,将全部的样本子集均进行S32-S38的处理,将获得的结果与真实的结果进行比较并迭代进行全网络参数的优化。

6.根据权利要求5所述的识别手写汉字的方法,其特征在于,所述的路径扫描与LSTM处理包括步骤:

对每张图片进行四种路径扫描,每张图片得到四张顺序信息的扫描图片;

将每张所述扫描图片经过一层含有N核的LSTM层,分别得到N张对应图片。

7.根据权利要求5所述的识别手写汉字的方法,其特征在于,所述的卷积与求和处理包括步骤:

每张图片经过一个包含有M个卷积核的卷积层过滤得到特征矩阵,同一张信息图片所对应的图片的特征矩阵为相关特征矩阵,将所述相关特征矩阵进行求和并进行非线性运算获得特征图像。

8.根据权利要求1所述的识别手写汉字的方法,其特征在于,所述步骤S4包括:

S41,将步骤2中所述的样本集按照比例分为训练集,测试集和验证集;

S42,基于获得按照预定比例设置的训练集、测试集和验证集,采用梯度下降法优化所述手写汉字文本初始识别模型的参数,并基于GPU加速器迭代进行模型训练。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711459778.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top