[发明专利]手写轨迹的检测、规范化和在线识别以及异常字根的收集有效

专利信息
申请号: 201310202701.9 申请日: 2013-05-28
公开(公告)号: CN104008363B 公开(公告)日: 2017-08-01
发明(设计)人: 许梅芳;李建杰 申请(专利权)人: 佳能株式会社
主分类号: G06K9/00 分类号: G06K9/00;G06K9/68
代理公司: 中国国际贸易促进委员会专利商标事务所11038 代理人: 刘倜
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 手写 轨迹 检测 规范化 在线 识别 以及 异常 字根 收集
【说明书】:

技术领域

本公开涉及用于字符的手写轨迹的检测、规范化、以及在线识别方法和装置,以及用于收集异常字根的方法和装置。

背景技术

以中文以及日文汉字(kanji)为代表的字符系统(其也被称为方块字或象形文字(ideographic character))通常包含多个笔画(stroke),其中的某些笔画或笔画组合常常被作为字根(radical)(例如但不限于,中文中的偏旁部首)。另外,某些字根可以与例如相邻的笔画组成更高级别的字根。

象形文字之类的字符的书写通常要比以英文为代表的表音字符系统要复杂得多。例如,中文(汉字)对于每一个字都具有标准的书写方式(writing style),包括:笔画的数目、笔画的书写顺序(笔顺)和方向,等等。

对于以中文(汉字)为代表的字符系统,键盘式的输入(到终端设备,例如计算机、移动终端等)常常是麻烦和低效的。随着手写板以及手机等便携式设备的普及,手写字符输入成为一种趋势。

然而,中文(汉字)字符众多,书写方式多样。并且,在书写时,为了简化和快捷,很多人并不是严格遵循标准的书写方式,并且笔画形状(stroke shape)和/或字根形状也可能发生变形,例如行书和草书等。并且,对于一些字根,特别是由较少笔画构成的字根,为了书写的便利,很多人会倾向于简化其书写,从而使得所写就的字根不符合标准的书写方式。通常,可以将这样的不符合标准的书写方式(例如,具有异常的笔画连接)的字根称为异常字根(abnormal radical)。例如,图8B示出了异常字根的一个示例。因此,这对高准确率地识别手写字符提出了挑战。

典型地,字符识别包括基于在线信息的在线识别和基于离线信息的离线识别。字符识别通常使用字典,字典可以包括用于字符的标准模板和/或基准模型。标准模板可以包括例如下列中的一项或多项:笔画构成,笔画数量,笔画的位置(起止点坐标),其它参考点坐标,等等。基准模型可以包括例如字符笔画的概率分布,笔画的起止点统计信息等等。本领域中已知用于字符识别的多种字典以及多种标准模板和/或基准模型。

在线识别将每一字符看作是笔移动(书写)的时间上的序列。也就是说,将手写轨迹看作具有分离笔画指示的坐标点的序列。因此,对于每一字符(文字),存在标准的序列,据此可以构造用于该字符(文字)的基准模型(reference model)以用于在线识别。从而,可以评估手写轨迹与用于在线识别的基准模型的匹配度,由此得到候选字符。例如但不限于,该匹配度可以作为识别置信度。

由于在线识别是基于轨迹序列的匹配,而一些常用的弹性的序列匹配方法(譬如隐马尔科夫模型(Hidden Markov Model,HMM)算法、动态时间归整(Dynamic Time Warping,DTW)算法等)对变形的字符具有较为鲁棒的匹配结果,因此即使对于形状变形了的字符,也能够实现相对精确的输入的序列和基准序列(reference sequence)之间的匹配。然而,在线识别对书写的顺序敏感,而书写顺序与笔画的数目、笔画的书写顺序和方向(也即,书写方式)高度相关,其中的变化很可能导致不准确的识别。

另外,与离线识别相比,某些在线书写信息易于提取,例如,笔画的数目、笔画的书写顺序、每一笔画的书写方向。然而,由于笔画的不同书写方式,字符的手写迹线的笔画的数目、笔画的书写顺序、每一笔画的书写方向常常会发生变化。因而,书写方式的变化将影响在线识别的识别性能。

对此,在现有技术中提出了一些在字符识别字典中记录书写方式变化(原型)的方法,例如可以见:

现有技术文献1:Masaki N,Kaoru M所著“Collection of on-line handwritten Japanese character pattern databases and their analyses”,IJDAR(2004)7:69-81;

现有技术文献2:Akihito K,Masaki N所著“Prototype learning of structured pattern representation applied to on-line recognition of handwritten Japanese characters”,IJDAR(2007)10:101-112

现有技术文献3:US09/020838;

现有技术文献4:US13/214222。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310202701.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top