[发明专利]手写汉字书写质量评价方法及系统有效
申请号: | 201811433192.X | 申请日: | 2018-11-28 |
公开(公告)号: | CN109543777B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 殷飞;张颐康;刘成林 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/34 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写 汉字 书写 质量 评价 方法 系统 | ||
1.一种手写汉字书写质量评价方法,其特征在于,所述评价方法包括:
获取待评价手写汉字图像,所述待评价手写汉字图像为由红色田字格及田字格中的手写汉字形成的彩色图像;
去除所述待评价手写汉字图像中的田字格,得到字体图像;
对所述字体图像进行灰度化处理,得到灰度图像;
对所述灰度图像进行透视化处理得到变换图像;
将变换图像分割成多个单个的汉字;
通过卷积神经网络对各个汉字进行评价,确定待评价手写汉字图像的书写质量,包括:
设N为评价一个人书写质量所需的字数,Xi为数据集中属于第i个人的汉字的集合,其大小为M;
当N大于M时,将该人的每幅图像均读入;然后使N`=N-M,且将N的值更新为N`,当当前N仍然大于M时,重复更新,直至N小于M时,从M个汉字中随机挑选N个,然后结束循环;此时从集合Xi中挑选了N张字(Xi1,Xi2...XiN)作为打分模块的输入;
对所述打分模块输出单个字的分数进行排序,然后再输入所述评价模块确定所述待评价手写汉字图像的书写质量;
其中,所述卷积神经网络包括打分模块以及与打分模块连接的评价模块;
所述打分模块的构建方法为:利用不含书写质量标签的离线手写汉字数据库预训练一个的神经网络;将预训练得到的神经网络的损失函数Softmax层去掉,同时将所述神经网络中的最后一个全连接层替换为输出为一通道的全连接层,得到打分模块;
所述评价模块的构建方法为:利用有书写质量标签的数据继续训练神经网络,确定评价模块。
2.根据权利要求1所述的手写汉字书写质量评价方法,其特征在于,所述去除所述待评价手写汉字图像中的田字格,得到字体图像,具体包括:
将所述待评价手写汉字图像进行红色R通道变换,得到红色R通道图像;
将所述红色R通道图像中像素大于设定的像素阈值的像素设置为白色,得到变换像素图像;
将所述变换像素图像进行红色R通道逆变换,得到字体图像。
3.根据权利要求2所述的手写汉字书写质量评价方法,其特征在于,所述去除所述待评价手写汉字图像中的田字格,得到字体图像,还包括:
去除得到变换像素图像的过程中产生的噪声。
4.根据权利要求3所述的手写汉字书写质量评价方法,其特征在于,所述去除得到变换像素图像的过程中产生的噪声,具体包括:
对于所述变换像素图像中的每一个联通部件,统计所述联通部件中包含像素个数n,并确定外接该联通部件的矩形的左上角坐标及右下角坐标,其中,左上角坐标为(left,up),右下角坐标为(right,down);
如果n20或者n/max(right-left+1,down-up+1)4,则该联通部件为噪声,将该联通部件中的每个像素均置为白色,否则保存不变。
5.根据权利要求1所述的手写汉字书写质量评价方法,其特征在于,所述对所述灰度图像进行透视化处理得到变换图像,具体包括:
设所述灰度图像的高为H,宽度为W,图像左上顶点为O,O点坐标为(0,0),竖直向下为X轴方向,水平向右方向为Y轴方向,确定坐标图像;
对所述坐标图像进行噪声点搜索,确定文本框的左上角P1;
以左上角P1为参考确定右上角P2,以所述右上角P2为参考确定右下角P3,以所述左上角P1为参考或者以所述右下角P3为参考确定左下角P4;
构建一副高为H/2,宽为W的新图像;
通过字体图像中由P1,P2,P3,P4截得的四边形对所述新图像进行图像变换,确定变换图像;其中,P1、P2、P3、P4分别对应变换图像中的(0,0)、(0,W-1)、(H/2-1,W-1)、(H/2-1,0)四点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811433192.X/1.html,转载请声明来源钻瓜专利网。