[发明专利]一种文字识别方法及装置在审
申请号: | 201910045727.4 | 申请日: | 2019-01-17 |
公开(公告)号: | CN109800749A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 何璇;王润民;杨剑锋;李秀梅 | 申请(专利权)人: | 湖南师范大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州三辰专利事务所(普通合伙) 44227 | 代理人: | 吴清瑕 |
地址: | 410006 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字识别 特征图像 文字图像 文本框 信息录入 冗余 剔除 方法和装置 尺度变换 特征提取 网络 图书馆 书籍 检测 | ||
本发明提供一种文字识别方法和装置。该方法包括:获取待识别文字图像;其中所述待识别文字图像包括书籍著录信息;采用第一深度网络对所述待识别文字图像进行特征提取,得到第一特征图像;对所述第一特征图像进行尺度变换,获得第二特征图像;对所述第二特征图像进行文本框检测,剔除冗余的文本框;采用第二深度网络对剔除冗余之后的文本框进行文字识别,得到文字识别结果。本发明实施例的文字识别方法能够有效缩短图书馆藏书信息录入耗费时间,大大提高了信息录入效率。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字识别方法及装置。
背景技术
随着社会的发展和进步,知识得到广泛的普及,图书馆也越来越多,图书馆中的藏书也越来越多。传统的图书馆的藏书信息是通过人工一本一本的手动录入,耗费时间长,信息录入效率低。
发明内容
本发明涉及一种文字识别方法及装置,以解决现有图书馆藏书信息录入方式耗费时间长,信息录入效率低的问题。
为了解决上述问题,本发明实施例提供了一种文字识别方法,包括:
获取待识别文字图像;其中所述待识别文字图像包括书籍著录信息;
采用第一深度网络对所述待识别文字图像进行特征提取,得到第一特征图像;
对所述第一特征图像进行尺度变换,获得第二特征图像;
对所述第二特征图像进行文本框检测,剔除冗余的文本框;
采用第二深度网络对剔除冗余之后的文本框进行文字识别,得到文字识别结果。
进一步的,所述采用深度网络对所述待识别文字图像进行特征提取,得到第一特征图像的步骤,包括:
采用第一深度网络对所述待识别文字图像进行特征提取;
确定所述第一深度网络最后一个密集块的后两层输出的特征图像为所述第一特征图像。
进一步的,所述对所述第一特征图像进行尺度变换,获得第二特征图像的步骤,包括:
对所述第一特征图像进行上采样,获得高分辨率特征图像;
对所述第一深度网络最后一个密集块的前三层进行池化操作,获得低分辨率特征图像;
确定所述高分辨率特征图像和所述低分辨率特征图像为所述第二特征图像。
进一步的,所述对所述第二特征图像进行文本框检测,剔除冗余的文本框的步骤,包括:
采用垂直文本框检测器对所述第二特征图像进行文本框检测,获得候选文本框;
对所述候选文本框进行非极大值抑制,剔除候选文本框中的冗余文本框。
进一步的,所述采用第二深度网络对剔除冗余之后的文本框进行文字识别,得到文字识别结果的步骤,包括:
采用循环深度神经网络对剔除冗余之后的候选文本框进行文字识别;
获得所述候选文本框对应的书籍著录信息;其中,所述书籍著录信息包括书名、作者名和出版社。
进一步的,本发明实施例还提供了一种文字识别装置,包括:
获取模块,用于获取待识别文字图像;其中所述待识别文字图像包括书籍著录信息;
特征提取模块,用于采用第一深度网络对所述待识别文字图像进行特征提取,得到第一特征图像;
尺度变换块,用于对所述第一特征图像进行尺度变换,获得第二特征图像;
检测模块,用于对所述第二特征图像进行文本框检测,剔除冗余的文本框;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南师范大学,未经湖南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910045727.4/2.html,转载请声明来源钻瓜专利网。