[发明专利]一种基于无监督学习的手写体图像识别方法及系统在审
申请号: | 202011038830.5 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112183335A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 梁循;张树森;薛扬;付虹蛟 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06T5/50;G06T7/11;G06T7/136 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 手写体 图像 识别 方法 系统 | ||
本发明属于图像识别技术领域,涉及一种基于无监督学习的手写体图像识别方法及系统,包括以下步骤:S1对图像进行预处理,获得图像的二值化矩阵;S2将二值化矩阵在水平、垂直和倾斜方向进行特征值提取,并获得水平、垂直和倾斜方向的特征向量;S3将水平、垂直和倾斜方向的特征向量融合成一个特征向量;S4利用机器学习模型对经过融合后的特征向量进行训练,得到图像分类模型;S5将待测手写体图像输入图像分类模型,获得识别结果。其充分考虑到了手写体文字的基本特征,即横竖撇捺四个方向的笔画,有助于更好读取手写体文字的内容,为其他垂直领域的图像特征构建提供可借鉴的思路。
技术领域
本发明涉及一种基于无监督学习的手写体图像识别方法及系统,属于图像识别技术领域。
背景技术
手写体识别过程往往是通过机器识别图像中的手写体,即将人们手写的内容通过扫描、拍照等方式转换成电子图像形式进行分析处理。在这个过程中,主要涉及对图像特征的提取和融合。图像特征提取是计算机图像处理中的一个基本概念,指的通过计算机提取图像信息,决定每个图像的点是否属于一个图像特征。其最终结果是将图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。图像特征可以从图像的边缘、角、区域、脊等角度进行提取和表示。当前,常用的图像特征有颜色特征、纹理特征、形状特征和空间关系特征。从应用价值上看,手写体识别研究对人机交互领域和文字信息自动处理领域具有重要实际价值。在人机交互领域,可以提高人机交互的自然性友好性,是未来智能人机接口的重要组成部分。在文字信息自动处理领域,可以节省人力,提高工作效率,加快信息流动,适应信息时代的要求。同时,对基于摄像机或数码相机的视频图像的文字识别,证件防伪术中的文字识别,在工业现场环境下对工件上字符的识别以及名片管理中的文字识别等应用领域也具有重要的经济效益和社会效益。
目前,随着卷积神经网络(Convolutional Neural Network,CNN)等深度神经网络的创新与发展,有监督的汉字识别问题基本得到解决,即在有标签的情况下,对汉字进行识别是可行的,且准确率较高,但是从目前的技术水平来看,在无监督的情况下,对汉字进行识别是基本不可能的,在无监督的情况下,深度神经网络难以对图片的特征进行处理。
手写体识别是模式识别和人工智能领域中的重要研究内容,在人机自然交互和文字信息自动处理等领域有着广泛的应用。实际上,由于手写体具有结构复杂,不同书写者风格各异,下笔轻重、笔画粗细、字体大小、旋转方向,倾斜角度等都可能不同的特点,同时书写过程中也会存在连笔和断笔甚至多余笔画的情况。因此,无监督手写体识别一直是文字识别领域中的难题,目前还没有得到很好的解决,依然得到了人们的广泛关注和研究。
发明内容
针对上述问题,本发明的目的是提供一种基于无监督学习的手写体图像识别方法及系统,其充分考虑到了手写体文字的基本特征,即横竖撇捺四个方向的笔画,有助于更好读取手写体文字的内容,为其他垂直领域的图像特征构建提供可借鉴的思路。
为实现上述目的,本发明采取以下技术方案:一种基于无监督学习的手写体图像识别方法,包括以下步骤:S1对图像进行预处理,获得图像的二值化矩阵;S2将二值化矩阵在水平、垂直和倾斜方向进行特征值提取,并获得水平、垂直和倾斜方向的特征向量;S3将水平、垂直和倾斜方向的特征向量融合成一个特征向量;S4利用机器学习模型对经过融合后的特征向量进行训练,得到图像分类模型;S5将待测手写体图像输入图像分类模型,获得识别结果。
进一步,S1中的预处理方法为:首先对彩色图像进行灰度化处理,生成灰度图像,再将灰度化图像进行二值化处理,从而得到与图像对应的二值化矩阵。
进一步,二值化处理方法为:将灰度化图像中灰度大于阈值的像素点用1表示,灰度小于阈值的用0表示。
进一步,步骤S2中水平、垂直方向获得特征向量的方法为:对于二值化矩阵,通过在水平方向进行列相加,提取图片水平特征向量;通过在垂直方向进行列相加,并对经过垂直方向列相加后获得的矩阵进行转置,得到垂直特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011038830.5/2.html,转载请声明来源钻瓜专利网。