[发明专利]识别手写汉字的方法、系统及设备在审

专利信息
申请号: 201711459778.9 申请日: 2017-12-28
公开(公告)号: CN108364037A 公开(公告)日: 2018-08-03
发明(设计)人: 武晨 申请(专利权)人: 顺丰科技有限公司
主分类号: G06K9/68 分类号: G06K9/68;G06K9/62;G06N3/04
代理公司: 北京志霖恒远知识产权代理事务所(普通合伙) 11435 代理人: 梁风霞
地址: 518061 广东省深圳市南山区学府路(以南)*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 手写汉字 文本识别 系统及设备 初始模型 信息图片 样本集 人力资本 手写文本 训练样本 准确率 打字 样本 场景 移植 图片 创建 优化
【说明书】:

发明公开了识别手写汉字的方法、系统及设备,所述方法步骤包括:S1,从待识别图片中提取手写汉字区域,再从所述手写汉字区域中提取出若干张信息图片;S2,以步骤S1中所述的信息图片为样本,创建手写汉字识别的样本集;S3,建立手写汉字文本识别初始模型;S4,以步骤S2中所述的样本集为基础,对所述手写汉字文本识别初始模型进行优化,得到手写汉字文本识别模型;S5,利用所述手写汉字文本识别模型,对待识别图片进行识别。所述系统及设备用于实现所述方法。本发明技术能部分代替人工打字录单的过程,不仅缩减了大量的人力资本,而且大幅度提高了录单的准确率,而且技术方案不仅可以识别运单上的手写文本,通过准备不同的训练样本,该方案还可以移植到其他场景下的手写汉字的识别。

技术领域

本发明涉及手写汉字识别技术领域,尤其涉及识别手写汉字的方法、系统及设备。

背景技术

当前人工智能领域已经可以实现对单一手写汉字的较准确的识别,所以通过手写的地址文本切分成单个汉字并依次进行识别本可以实现完整地址的识别,但是,目前“切割汉字的技术”还没有发展到可以保证正确率的程度,进而导致识别结果正确率很低。

另外,快递在被运送路上之前,每一件快递都要经历录单的过程,目的是将运单上的二维码与寄件人手写的地址信息的对应关系保存在电脑里,进而之后的收发结点仅仅通过扫描二维码来获取该快件的目标地址。而且,目前我们的录单过程都是依靠人工手动敲打键盘来把运单上的手写地址录入电脑系统里,这样不仅消耗大量的人力成本,还无法保证录单的正确率。一旦录入的地址错误,对应的快递就会毫无悬念的被寄往错误的地点。

终上所述,现有技术存在的问题是:“切割汉字的技术”还没有发展到可以保证正确率的程度,进而导致识别结果正确率很低,并且在快递行业,人工打字录单的过程会消耗大量的人力成本,而且枯燥重复的工作,会让人工识别地址经常出错,并且由于手写地址是一串没有间隔的汉字,同时汉字往往是左右或者上下结构的,所以将地址切分成一个一个的汉字是事倍功半的过程。

发明内容

为了解决上述现有技术中的不足,本发明的目的在于提供一种识别手写汉字的方法及其应用。

本发明解决其技术问题所采用的技术方案为:

识别手写汉字的方法,包括以下步骤:

S1,从待识别图片中提取手写汉字区域,再从所述手写汉字区域中提取出若干张信息图片;

S2,以步骤S1中所述的信息图片为样本,创建手写汉字识别的样本集;

S3,建立手写汉字文本识别初始模型;

S4,以步骤S2中所述的样本集为基础,对所述手写汉字文本识别初始模型进行优化,得到手写汉字文本识别模型;

S5,利用所述手写汉字文本识别模型,对待识别图片进行识别。

步骤S1中所述的待识别图片为运单图片。

所述步骤S1包括步骤:

S11,获取运单图片;

S12,调整所述运单图片,使所述运单图片的底边与水平线的偏差角度在预设的误差范围内;

S13,将步骤S12中调整过的运单图片与空白运单图片进行对比、抵消,获得运单图片中的填写内容;

S14,以所述运单图片左侧边沿为初始边截取整张运单图片的40%-75%的区域作为有效信息区域,获取有效信息区域的图片;

S15,从所述有效信息区域的图片中提取若干张信息图片。

所述步骤S2包括步骤:

S21,对步骤S1中全部的信息图片进行命名,每一张所述信息图片对应唯一命名;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711459778.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top