[发明专利]对手写字符的无旋转识别有效
申请号: | 201280071668.4 | 申请日: | 2012-03-23 |
公开(公告)号: | CN104205126B | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | Q·霍;J·杜 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 罗婷婷 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符识别系统 标准化 预处理 方向对齐 手写字符 字符原型 开始点 笔画 释放 | ||
1.一种在字符训练和/或字符识别期间将接收到的字符旋转到标准化定向的方法,包括:
在配置有可执行指令的一个或多个处理器的控制下:
接收包括多个笔画的文本字符;以及
基于所述多个笔画中的一笔画的至少两个点将所述文本字符旋转到标准化方向;
所述旋转包括:
将第一坐标计算为所述多个笔画的子集的各开始点的坐标的第一加权和;以及
将第二坐标计算为所述多个笔画的所述子集的各结束点的坐标的第二加权和,其中所述旋转包括旋转所述文本字符以使得所述第一坐标和所述第二坐标之间的线与所述标准化方向对齐。
2.如权利要求1所述的方法,其特征在于,进一步包括基于识别模型来识别经旋转的文本字符。
3.如权利要求1所述的方法,其特征在于,所述至少两个点包括所述多个笔画中的所述笔画的开始点和结束点。
4.如权利要求1所述的方法,其特征在于,所述第一加权和或所述第二加权和包括:
所述开始点或所述结束点的坐标的平均和,或
具有用与所述开始点或所述结束点的坐标相关联的多个笔画的子集的长度加权的系数的所述开始点或所述结束点的坐标的和。
5.如权利要求1所述的方法,其特征在于,所述多个笔画的子集包括所述多个笔画中的所有笔画、所述多个笔画中的预定数目的最长笔画、所述多个笔画中的预定百分比的最长笔画、所述多个笔画中的具有大于或等于预定长度阈值的长度的笔画、和/或所述多个笔画中的具有大于或等于所述多个笔画的平均长度的长度的笔画。
6.如权利要求1所述的方法,其特征在于,所述旋转独立于由用户写入的文本字符的多个笔画的次序。
7.如权利要求1所述的方法,其特征在于,所述接收包括接收所述文本字符的多个笔画的开始点和结束点的坐标。
8.如权利要求1所述的方法,其特征在于,进一步包括确定所述多个笔画的开始点和结束点,而无需知道或跟踪所述多个笔画的写入方向。
9.如权利要求1所述的方法,其特征在于,进一步包括基于对写入笔画的约定的试探式假定来确定所述多个笔画的开始点和结束点。
10.如权利要求8所述的方法,其特征在于,所述写入笔画的约定包括从左到右写入以及从上到下写入。
11.一种在字符训练和/或字符识别期间将接收到的字符旋转到标准化定向的方法,包括:
在配置有可执行指令的一个或多个处理器的控制下:
接收包括多个笔画的文本字符;
计算所述多个笔画中从所述多个笔画的至少两个点中的第一点到所述多个笔画的至少两个点中的第二点的每一笔画的方向;
将向量和方向计算为所述多个笔画的方向的向量和;以及
旋转所述文本字符以使得所述向量和方向与标准化方向对齐。
12.一种训练识别模型的方法,包括:
接收多个手写文本字符;
对于所述多个手写文本字符中的每一手写文本字符,根据权利要求1或11所述的方法将该手写文本字符旋转到标准化方向;
从所述多个经旋转的手写文本字符提取特征;
基于使用弹性传播(Rprop)算法来优化基于样本分割边缘(SSM)的最小分类误差(MCE)目标函数来训练字符识别模型;
使用分割向量量化(SVQ)技术来压缩所述字符识别模型的参数;以及
构造用于在运行时识别未知文本字符的两层的快速匹配树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280071668.4/1.html,转载请声明来源钻瓜专利网。