[发明专利]手写识别方法及装置在审
申请号: | 201810975834.2 | 申请日: | 2018-08-24 |
公开(公告)号: | CN110858317A | 公开(公告)日: | 2020-03-03 |
发明(设计)人: | 辛晓哲 | 申请(专利权)人: | 北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 北京华圣典睿知识产权代理有限公司 11510 | 代理人: | 赵景平 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写 识别 方法 装置 | ||
本发明公开了一种手写识别方法及装置,该方法包括:获取字符笔迹;获取对应所述字符笔迹所属语言类别的切分模型;利用所述切分模型对所述字符笔迹进行切分,得到切分块序列;对所述切分块序列进行识别,得到所述字符笔迹对应的字符串。利用本发明,可以在数据资源相对较少的情况下,也能够达到相对较高的识别准确率。
技术领域
本发明涉及手写识别领域,具体涉及一种手写识别方法及装置。
背景技术
手写识别技术,是指将在手写设备上书写时产生的有序轨迹信息转化为文字内码的过程,实际上是手写轨迹的坐标序列到文字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。随着智能手机、掌上电脑等智能终端的普及,手写识别技术也进入了规模应用时代。
由于不同国家的语言具有不同的书写特点,因此,现有针对单一语种的手写识别技术不能很好地实现对其它语种手写文本的识别。为此,业内提出了一些针对多国语言进行手写识别的技术方案,比如基于LSTM(Long Short-Term Memory,长短期记忆网络)+CTC(Connectionist Temporal Classification)的序列识别方法,基于规则的HMM(HiddenMarkov Model,隐马尔科夫模型)方法等。其中,LSTM方法需要大量数据训练才能得到较好的收敛结果,需要大量的计算资源和训练时间,才能取得较好的字准确率(词准确率会相应幅度降低更多);而基于HMM的方法虽然能够有效解决草书连笔问题,但是该方法在特征提取的过程非常困难,而特征提取又直接影响到最终模型效果。
发明内容
本发明实施例提供一种手写识别方法及装置,可以在数据资源相对较少的情况下,也能够达到相对较高的识别准确率。
为此,本发明提供如下技术方案:
一种手写识别方法,所述方法包括:
获取字符笔迹;
获取对应所述字符笔迹所属语言类别的切分模型;
利用所述切分模型对所述字符笔迹进行切分,得到切分块序列;
对所述切分块序列进行识别,得到所述字符笔迹对应的字符串。
可选地,所述语言类别包括:连笔字符书写类语言和非连笔字符书写类语言。
可选地,所述方法还包括:通过以下方式预先构建对应连笔字符书写类语言的切分模型:
采集连笔笔迹数据作为训练样本,并标注所述训练样本的切分点;
确定每个训练样本的特征信息;所述特征信息包括:所述训练样本的基线;所述基线为所述字符笔迹在Y轴或X轴投影坐标点数量最多的区间的均线;
确定所述训练样本与其基线的交点,并将所述交点作为预估切分信息;
利用所述预估切分信息及标注信息训练得到对应连笔字符书写类语言的切分模型。
可选地,所述切分模型为回归模型或者卷积神经网络模型。
可选地,所述方法还包括:在对所述切分块序列进行识别之前,判断所述字符笔迹对应的语言类别是否为易产生过切分的语言;如果是,则对所述切分块序列中的切分块进行组合处理;否则执行对所述切分块序列进行识别的步骤。
可选地,所述对所述切分块序列中的切分块进行组合处理包括:
提取各切分块的几何特征;
利用预先构建的多元几何模型及相邻切分块的几何特征判断所述相邻切分块是否属于同一个字符;
如果是,则将所述相邻切分块合并。
可选地,所述方法还包括:通过以下方式预先构建所述多元几何模型:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司,未经北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810975834.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:集液箱
- 下一篇:衣物处理设备及其底座组件