[发明专利]一种基于鲁棒性模板的倾角文字精准识别方法及系统有效
申请号: | 202110876329.4 | 申请日: | 2021-07-31 |
公开(公告)号: | CN113313217B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 胡茂厅 | 申请(专利权)人: | 北京惠朗世纪科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 张丽 |
地址: | 102600 北京市大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 鲁棒性 模板 倾角 文字 精准 识别 方法 系统 | ||
本发明公开了一种基于鲁棒性模板的倾角文字精准识别方法,包括以下步骤:建立样本图像数据集;建立对应文字类别的多个鲁棒性文字模板;将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建;计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度;根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤;计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度;确定待识别倾角文字图像块的文字类别。本发明公开了一种基于鲁棒性模板的倾角文字精准识别系统。本发明有效提升了倾角文字识别的精准度。
技术领域
本发明涉及文字识别技术领域,具体而言,涉及一种基于鲁棒性模板的倾角文字精准识别方法及系统。
背景技术
在数字媒体时代,海量的图片已经成为了一种重要的信息载体,发挥了越来越重要的价值。例如,银行的票据、公司的财务报表等都可以用图片的形式展示和存储。虽然我们可以较为方便地阅读图像中的文字信息,但是无法对文字信息进行有效识别并编辑,因此如果能够有效地识别出图片中的文字有着非常重要的价值。传统的文字方法虽然能够识别出图片中的文字,但当文字出现一定的倾角时,它们往往无法较好地被识别出来。因此,如何建立一种有效的倾角文字识别方法,对于倾角文字仍然有较高的识别精度是一项亟待解决的工作。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于鲁棒性模板的倾角文字精准识别方法及系统,有效提升了倾角文字识别的精准度。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种基于鲁棒性模板的倾角文字精准识别方法,包括以下步骤:
获取样本文字图像块,并建立样本图像数据集;上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块;
根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板;
获取待识别倾角文字图像块,并将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块;
计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度,以得到各个尺度下的相似度值;
根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;
采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤,以得到过滤待识别倾角文字图像块和过滤模板文字图像块;
计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度,以得到过滤图像相似度值;
根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠朗世纪科技有限公司,未经北京惠朗世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110876329.4/2.html,转载请声明来源钻瓜专利网。