[发明专利]一种中日文手写文本的识别方法在审
申请号: | 201610895677.5 | 申请日: | 2016-10-14 |
公开(公告)号: | CN106570518A | 公开(公告)日: | 2017-04-19 |
发明(设计)人: | 刘建生 | 申请(专利权)人: | 上海新同惠自动化系统有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06K9/46;G06N3/12 |
代理公司: | 上海集信知识产权代理有限公司31254 | 代理人: | 洪玲 |
地址: | 201500 上海市金山*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种中日文手写文本的识别方法,能够对手写文本输入的字符串进行识别,有较高的识别准确率,属于一种字符串联机手写识别的鲁棒模型。包括对笔画间隔进行过分割,在分割点和非分割点外,还引入了待定点;为每个候选字符图形联系许多个候选集;基于手写文本与字符串集的概率近似,结合特征识别、一元和二元几何特性以及语言环境,评估候选分割和识别路径的可信度;路径评价的标准灵活的结合了上下文的得分,且不随路径长度变化,因此采用维特比搜索可以有效的得出最优分割路径及其对应的字符串集。此外,评价模型的参数由遗传算法估算,从而优化整体字符串识别的性能。 | ||
搜索关键词: | 一种 日文 手写 文本 识别 方法 | ||
【主权项】:
一种中日文手写文本的识别方法,其特征在于,该方法主要包括以下步骤:步骤100,笔画的过分割,包括每个笔画间隔被分类,即分割点、非分割点和待定点;步骤102,字符图形的候选格构造,包括通过字符分类,将每个候选字符图形与许多的候选集相联系起来;步骤104,分割图形的可信度评价,包括对应候选集来评估候选字符图形的得分;步骤106,字符串的路径评估,包括累计可信度得分,以及减少评估中不重要的参数;步骤108,寻找最优路径,识别字符串;结合分割路径的候选字符的评估及其与字符串集的得分以及字符兼容性,改善路径评价标准,得出与正确分割和识别对应得最好的路径;在所述步骤100中,笔画的过分割将字符串图形X=s1,…,sm分割为候选字符图形Z=z1,…,zn,其中,每个候选字符图形包含ki个原始分割,zi=sji,…sji+ki‑1;字符的分割图形则被归为集C=C1,…,Cn;一个字符集Cj由一个或多个连续的ci构成;ci代表一个字符串或者原始分割块的一个假想分类或称之为过分类;在所述步骤104中,可信度评价方法包括对应字符集C来评估字符串图形X的得分,提取边界框特征值b,内部间隙特征值q,单个分割块或字符的一元位置特征值pu,分割块间隙特征值g,相邻分割块或字符的二元位置特征值pb,数据识别程序和几何得分函数通过训练数据库得到,包括条件可信度p(zi|Ci),几何得分p(bi|Ci),p(qi|Ci),和字符串的后验可信度为:P(C|X)=P(C|q,X,pu,pb,g)=p(b,q,X,pu,pb,g|C)P(C)p(b,q,X,pu,pb,g),]]>对字符串集的评价等同为:f(X,C)=logp(b,q,X,pu,pb,g|C)P(C)=logp(C)+Σi=1mlogp(bi|ci)+logp(qi|ci)+logp(si|ci)+logp(biu|ci)+logp(|ibci-1,ci)+logp(gi|ti),]]>logP(C)=Σi=1mlogP(ci|ci-2ci-1)=Σi=1m[logP(cji|cji-2cji-1)+Σj=ji+1ji+ki-1logP(cji|cji-2cji-1)]≈Σi=1m[λ11logP(Ci|Ci-2Ci-1)+λ12Σj=ji+1ji+ki-1P(Ci|Ci-2Ci-1)+λ1)=Σi=1n{[λ11+λ12(ki-1)]·logP(Ci|Ci-2Ci-1)+λ1}]]>在所述步骤106中,累计路径得分为:f(X,C)=Σh=16[λh1+λh2(ki-1)]logPh+λ71logP(gji|SP)+λ72Σj=ji+1ji+ki-1logP(gji|NSP)+nλ,]]>Ph,h=1,…6,分别表示P(Ci|Ci‑2Ci‑1),p(bi|Ci),p(qi|Ci),p(zi|Ci),和所述步骤106中的累计路径得分f(X,C)中,设定当h≠4时λh2=0,累计路径得分变为:f(X,C)=Σi=1nΣh=15λh1logPh+[λ61+λ62(ki-1)]logP(zi|Ci)+λ72logP(gji|SP)+λ72Σj=ji+1ji+ki-1logP(gji|NSP)+nλ,]]>其中,Ph,h=1,…5,分别表示P(Ci|Ci‑2Ci‑1),P(bi|Ci),P(qi|Ci),和λ为权重因子,SP和NSP分别代表分割点和非分割点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海新同惠自动化系统有限公司,未经上海新同惠自动化系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610895677.5/,转载请声明来源钻瓜专利网。
- 上一篇:具有插入柱的螺钉
- 下一篇:用于在患者体内供给流体物质的装置