[发明专利]一种基于无监督学习的手写体图像识别方法及系统在审
申请号: | 202011038830.5 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112183335A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 梁循;张树森;薛扬;付虹蛟 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06T5/50;G06T7/11;G06T7/136 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 手写体 图像 识别 方法 系统 | ||
1.一种基于无监督学习的手写体图像识别方法,其特征在于,包括以下步骤:
S1对图像进行预处理,获得所述图像的二值化矩阵;
S2将所述二值化矩阵在水平、垂直和倾斜方向进行特征值提取,并获得水平、垂直和倾斜方向的特征向量;
S3将所述水平、垂直和倾斜方向的特征向量融合成一个特征向量;
S4利用机器学习模型对经过融合后的特征向量进行训练,得到图像分类模型;
S5将待测手写体图像输入所述图像分类模型,获得识别结果。
2.如权利要求1所述的基于无监督学习的手写体图像识别方法,其特征在于,所述S1中的预处理方法为:首先对彩色图像进行灰度化处理,生成灰度图像,再将所述灰度化图像进行二值化处理,从而得到与所述图像对应的二值化矩阵。
3.如权利要求2所述的基于无监督学习的手写体图像识别方法,其特征在于,所述二值化处理方法为:将所述灰度化图像中灰度大于阈值的像素点用1表示,灰度小于阈值的用0表示。
4.如权利要求1所述的基于无监督学习的手写体图像识别方法,其特征在于,所述步骤S2中水平、垂直方向获得特征向量的方法为:对于所述二值化矩阵,通过在水平方向进行列相加,提取图片水平特征向量;通过在垂直方向进行列相加,并对经过垂直方向列相加后获得的矩阵进行转置,得到垂直特征向量。
5.如权利要求4所述的基于无监督学习的手写体图像识别方法,其特征在于,所述步骤S2中倾斜方向获得特征向量的方法为:对于所述二值化矩阵,沿倾斜方向对所述二值化矩阵中的向量进行叠加,得到一个倾斜方向的特征向量。
6.如权利要求5所述的基于无监督学习的手写体图像识别方法,其特征在于,所述倾斜方向为沿水平方向倾斜45度的方向或沿水平方向倾斜135度的方向。
7.如权利要求1所述的基于无监督学习的手写体图像识别方法,其特征在于,将所述步骤S3中经过融合的特征向量输入到流行学习降维方法中,将其高维特征降维至二维,对其进行可视化表示,观察所述经过融合的特征向量是否能够反映手写体文字的区别。
8.如权利要求7所述的基于无监督学习的手写体图像识别方法,其特征在于,所述流行学习降维方法采用T-分布随机邻域嵌入T-SNE方法进行降维,将高维空间中的数据在低维空间中重新表示。
9.如权利要求1-7任一项所述的基于无监督学习的手写体图像识别方法,其特征在于,所述机器学习模型采用逻辑回归模型实现多分类问题,所述多分类问题通过构建多个二分类模型实现多分类的功能。
10.一种基于无监督学习的手写体图像识别系统,其特征在于,包括:
图像预处理模块,用于对图像进行预处理,获得所述图像的二值化矩阵;
特征提取模块,用于将所述二值化矩阵在水平、垂直和倾斜方向进行特征值提取,并获得水平、垂直和倾斜方向的特征向量;
融合模块,用于将所述水平、垂直和倾斜方向的特征向量融合成一个特征向量;
识别模型生成模块,用于利用机器学习模型对经过融合后的特征向量进行训练,得到图像分类模型;
识别模块,用于将待测手写体图像输入所述图像分类模型,获得识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011038830.5/1.html,转载请声明来源钻瓜专利网。