[发明专利]基于哈希检索的手写英文单词智能识别方法有效
申请号: | 201811519961.8 | 申请日: | 2018-12-12 |
公开(公告)号: | CN109344279B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 马磊;陈义学;陈霞;张华英 | 申请(专利权)人: | 山东山大鸥玛软件股份有限公司 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06K9/46;G06K9/62 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 刘晓政 |
地址: | 250101 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 检索 手写 英文单词 智能 识别 方法 | ||
本发明公开提供了一种基于哈希检索的手写英文单词智能识别方法,包括以下步骤:步骤(1):提取数据库中每一张手写英文单词图像的视觉特征和标签信息,分别得到对应的视觉特征矩阵和标签信息矩阵;步骤(2):根据标签信息矩阵计算数据库中图像两两之间的相似性,得到相似性矩阵;步骤(3):利用视觉特征矩阵、标签信息矩阵和相似性矩阵,获得数据库中每一张手写英文单词图像的哈希码;步骤(4):根据获得的哈希码,学习视觉特征到哈希码的映射,即哈希函数;步骤(5):读取待检索的手写英文单词图像,利用哈希码检索数据库中图像的哈希码,完成图像识别。
技术领域
本发明涉及字符识别领域,具体涉及一种基于哈希检索的手写英文单词智能识别方法。
背景技术
随着信息技术的飞速发展,机器识别手写字符成为了研究的热门领域,字符识别技术涉及到图像处理、机器学习、模式识别等多个学科,并且广泛应用于手写文档电子化,减少人工录入成本,提高输入效率。
目前应用于脱机手写英文单词识别的主要方法有三类:结构方法、统计方法和神经网络方法。结构方法在实际应用中抗干扰能力差且复杂度高,这种技术已经逐渐衰弱。统计方法有很强的理论基础,其中基于隐马尔科夫模型的统计学方法具有很好的建模能力,对噪声和变形也都有较好的适应性,已经被广泛应用于脱机手写字符的识别中,并取得了不错的成果。近年来,深度学习发展迅速,由于神经网络有较强的学习能力和容错能力,很多基于神经网络的方法被提出,主要分为两大类:基于卷积神经网络的和基于递归神经网络的方法。基于卷积神经网络的方法一般用来做分类任务,利用卷积层提取图片的本质特征,用多层的全连接作为分类器;基于递归神经网络的方法利用递归神经网络考虑时间序列的优势,每一个时间戳生成一个字符,得到的字符序列就是识别结果。
但是,当前采用的脱机手写英文单词识别方法均存在手写单词形状严重变形等问题,脱机手写字符识别一直以来都是字符识别领域中的一个重点和难点。另外,基于检索的手写英文单词识别中需要对单词图库进行检索对比,而且数据量巨大,传统的检索方法往往难以保证实时性。
发明内容
针对以上问题,本发明的目的在于提供一种基于哈希检索的手写英文单词智能识别方法。基于哈希学习的检索在计算机视觉、机器学习、信息检索及相关领域已经得到了广泛的应用。哈希学习方法将文档、图片、视频或者其他类型的数据编码成二进制码,实际上是将数据从原始空间映射到海明空间中并且保持原始数据的相似性。有了二进制码,由于在同一空间中成对比较的高效性,最近邻搜索的任务可以在大规模数据集上进行。
本发明为实现上述目的,通过以下技术方案实现:一种基于哈希检索的手写英文单词智能识别方法,包括以下步骤:
步骤(1):提取数据库中每一张手写英文单词图像的视觉特征和标签信息,分别得到对应的视觉特征矩阵和标签信息矩阵;
步骤(2):根据标签信息矩阵计算数据库中图像两两之间的相似性,得到相似性矩阵;
步骤(3):利用视觉特征矩阵、标签信息矩阵和相似性矩阵,获得数据库中每一张手写英文单词图像的哈希码;
步骤(4):根据获得的哈希码,学习视觉特征到哈希码的映射,即哈希函数;
步骤(5):读取待检索的手写英文单词图像,利用哈希码检索数据库中图像的哈希码,完成图像识别。
进一步,所述步骤(1)的具体过程为:
步骤(1.1):假设有n幅手写英文单词图像,对每幅图像提取d维的视觉特征,使用了预训练好的VGG-19中conv5_4层的输出作为提取的图片特征,得到一个n×d视觉特征数据矩阵X=[x1,x2,...,xn]∈Rn×d,其中n表示实例的数量,d表示特征维度,c表示类别数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东山大鸥玛软件股份有限公司,未经山东山大鸥玛软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811519961.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视觉搜索方法、装置及设备
- 下一篇:一种基于图模型的流程图检索方法及系统