[发明专利]一种手写识别方法、系统及手写识别终端有效
申请号: | 201210205916.1 | 申请日: | 2012-06-18 |
公开(公告)号: | CN102750552A | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 李健;郑晓明;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手写 识别 方法 系统 终端 | ||
技术领域
本发明涉及模式识别技术,特别是涉及一种基于最大熵模型的手写识别方法、系统及手写识别终端。
背景技术
手写识别(Handwriting Recognize),是指将在手写设备上书写时产生的有序轨迹信息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字内码的一个映射过程,是人机交互最自然、最方便的手段之一。
目前用于手写输入的设备有许多种,比如电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等。用户在手写输入设备上书写的笔画以类似于矢量图的形式被计算机存储下来,通过对文字图像的抬笔、落笔、笔迹上各像素的空间位置等信息进行处理与对照,系统将数据转化为计算机所使用的文字编码进行输出。随着智能手机、掌上电脑等移动信息工具的普及,手写识别技术也进入了规模应用时代,可广泛应用于各种桌面操作系统、嵌入式操作系统中。
手输入的模式也从单字手写识别发展到了多字手写识别,多字字符的切割是影响手写识别准确性和用户体验性的关键技术,目前采用的字符切割算法大部分是基于规则来完成切割点的判断,且无法给出判断为切割点的概率,因此切割后的字符识别结果经常出现错误,从而导致识别率的下降,影响多字输入的手写体验。
发明内容
本发明提供一种手写识别方法、系统及字符识别终端,以解决现有的字符识别结果经常出现错误,导致识别率下降,进而影响多字输入的手写体验的问题。
为了解决上述问题,本发明公开了一种手写识别方法,包括:采集连续输入的笔迹;提取笔迹特征;将笔迹特征输入到最大熵模型中,最大熵模型判断当前的笔画是否为切割点;如果是,则对字符进行切割,得到最终识别结果。
优选的,最大熵模型判断当前的笔画是否为切割点包括:最大熵模型利用笔迹特征给出当前笔画为切割点的概率;如果得到的概率大于预设概率则当前笔画为切割点。
优选的,还包括确定预设概率的步骤,确定预设概率包括:对所述字符笔迹进行切割,得到至少一条切分路径;对各切分路径进行单字识别,针对每一个切分路径得到候选识别结果及得到该候选识别结果的第一概率值;利用语言模型对各候选识别结果进行打分,得出针对每个候选识别结果的表示字符间关联信息的第二概率值;根据各候选识别结果的第一概率值和第二概率值得到各候选识别结果的综合概率值;选择最大综合概率值为预设概率。
优选的,采集连续输入的笔迹包括:采集以叠字连续输入的字符笔迹或以行或以列连续输入的字符笔迹。
优选的,还包括建立最大熵模型,所述建立最大熵模型包括:选择最大熵模型特征,准备训练数据,训练最大熵模型。
优选的,选择的最大熵模型特征包括:选择以叠字连续输入的字符笔迹的笔迹特征;即选择笔画间的相对位置、笔画位于书写区域的位置、笔画落笔点所在的区域位置、抬笔点所在的区域位置、增加笔画的大小比例、笔画高度占书写区域高度的比例或笔画宽度占书写区域宽度的比例中至少一个特征作为最大熵模型的特征。
优选的,选择的最大熵模型特征包括:选择以行连续输入的字符笔迹的笔迹特征,即选择当前字符前面空隙的宽度、后面空隙的宽度和当前字符的宽高比中至少一个特征作为最大熵模型的特征;选择以列连续输入的字符笔迹的笔迹特征,即选择当前字符上面空隙的宽度、下面空隙的宽度和当前字符的宽高比中至少一个特征作为最大熵模型的特征。
本发明还公开了一种手写识别系统,包括:采集模块,用于采集连续输入的笔迹;特征提取模块:用于提取笔迹特征;切割模块,用于将笔迹特征输入到最大熵模型中,最大熵模型判断当前的笔画是否为切割点;识别模块,用于当当前的笔画为切割点时,对字符进行切割,得到最终识别结果。
优选的,手写识别系统还包括:确定模块,用于确定预设概率;所述确定模块包括:
切割子模块;用于对所述字符笔迹进行切割,得到至少一条切分路径;
单字识别子模块;用于对各切分路径进行单字识别,针对每一个切分路径得到候选识别结果及得到该候选识别结果的第一概率值;
语言模型识别子模块;用于利用语言模型对各候选识别结果进行打分,得出针对每个候选识别结果的表示字符间关联信息的第二概率值;
综合判断子模块;用于根据各候选识别结果的第一概率值和第二概率值得到各候选识别结果的综合概率值;
选择子模块;用于选择最大综合概率值为预设概率。
本发明还公开了一种手写识别终端,包括本发明公开的一种手写识别系统。
与现有技术相比,本发明具有以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210205916.1/2.html,转载请声明来源钻瓜专利网。