[发明专利]一种识别中文书写错误的方法在审
申请号: | 202010271926.X | 申请日: | 2020-04-09 |
公开(公告)号: | CN111507346A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 周品艺;王凯杰;周品智 | 申请(专利权)人: | 磐度科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 福州顺升知识产权代理事务所(普通合伙) 35242 | 代理人: | 陈为志 |
地址: | 中国香港观塘九*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 中文 书写 错误 方法 | ||
本发明公开了一种识别中文书写错误的方法,包括以下步骤:S1、建立文字的标准网格化点数据;S2、在练习书写的数位板上设置方格,确定各个方格对应的坐标范围;S3、书写时,将文字填入数位板的方格内,电磁数位板将采集到的笔划数据上传至书写识别平台;S4、书写识别平台将每个笔划数据区隔开,进行取点处理,以获得各个方格内的笔划的坐标采样数据;S5、根据笔划的坐标采样数据对文字的笔划进行划分;S6、划分好笔划的方格后,将每个字的书写数据送入模型当中,利用LSTM算法将字的书写数据与标准字数据库中的各个字的点数据进行比对分析。该方法对练习者书写的每个文字的笔划进行单独识别,识别成功率极高,可以识别出中文书写的各种错误。
技术领域
本发明涉及数据分析技术领域,更具体地说,它涉及一种识别中文书写错误的方法。
背景技术
近年来,为改进中文学习者对中文字符的书写和记忆,市面上出现了一些辅助书写装置,例如书写模板、书写识别装置(例如数位板)等。书写模块预先压制有文字形状的凹槽,书写者用笔顺着凹槽就能描出漂亮的文字,但是采用书写模块来练习书写需要大量的、重复的练习,耗时耗力且不利于练习者形成自己的书写风格;利用书写识别装置可以对练习者的书写字符进行识别,并能在出现书写错误时指出错误。
但是现有的现在的书写识别装置是通过建立标准模板库然后记录练习者的书写轨迹,通过将字符的轨迹简单地与字符模板进行相似度对比,从而对书写的结构性错误以及书写笔顺等进行判别。由于汉字书写的复杂度以及每个人书写的多样性,单纯地与标准模板进行对比并不能很好地反映书写的准确度,识别的准确率偏低,有待改进。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种识别中文书写错误的方法,其可以大大提高中文书写错误识别的准确率。
为实现上述目的,本发明提供了如下技术方案:
一种识别中文书写错误的方法,包括以下步骤:
S1、建立标准化的网格,以网格为参照建立标准字数据库,标准字数据库中包含各个文字的网格化点数据;
S2、练习者需要利用磁感应式的数位板进行书写练习,在数位板上设置有位置固定的方格,从而能确定各个方格在电磁数位板上对应的坐标范围;
S3、练习者在书写过程中,将文字填入数位板的方格内,电磁数位板对书写笔划进行采集,并将采集到的笔划数据上传至书写识别平台;
S4、书写识别平台将每个笔划数据区隔开,再送入算法中进行取点处理,以获得各个方格内的笔划的坐标采样数据;
S5、根据笔划的坐标采样数据对文字的笔划进行划分,确定各个笔划处于哪个方格内;
S6、划分好笔划的方格后,将每个字的书写数据送入模型当中,利用LSTM算法将字的书写数据与标准字数据库中的各个字的点数据进行比对分析,从而可以识别出是否出现书写错误。
作为优选方案,在S4步骤中,取点处理的具体方法为:将采集到的笔划划分为等长的20段,获得各段笔划的中点的坐标数据,即得到该笔划的采样坐标点集。
作为优选方案,在S5步骤中对笔划划分方格的规则为:若一个笔划的采样坐标点集都在某个方格内,则认为该笔划就属于该方格;若一个笔划的点集在几个方格里面,则分别计算该笔划在这几个方格内的点长,点长定义为sqrt(sqrt(Xt–Xt-1)+sqrt(Yt–Yt-1),其中(Xt,Yt)为该笔划在某个方格内的t时刻点坐标,笔划在哪个方格内的点长最长,则认为该笔划属于该方格;对于相邻的两个方格A和B,如果有连续三个笔划的方格划分为ABA,其中划分为B方格的笔划符合前面两种规则,则该笔划改为划分到A方格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于磐度科技有限公司,未经磐度科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010271926.X/2.html,转载请声明来源钻瓜专利网。