[发明专利]一种维语图片字符的识别方法及系统有效
申请号: | 201910583713.8 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110287952B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 孙萍;高岩;陈宏江;赵全军;杨浩 | 申请(专利权)人: | 中科软科技股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/62 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 张彩珍 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 字符 识别 方法 系统 | ||
本发明公开了维语图片字符的识别方法,包括:将采集的原始图片进行标记,将标记后的图片作为待训练样本;将待训练样本输入到CNN+BiLSTM模型中以提取待训练样本的特征向量,对待训练样本的特征向量进行训练,生成维文文本区域定位网络模型;将待训练样本中包含维语文本区域的图片输入CNN网络模型,提取所述维语文本区域的特征;将维语文本区域的特征输入BiLSTM+CTC网络模型中,获得维语字符序列,根据维语字符序列生成维语字符识别网络模型;利用维文文本区域定位网络模型识别待检测图片的维语文本区域;利用维语字符识别网络模型识别待检测图片的维语文本区域中的维语字符。本发明还公开了维语图片字符的识别系统。通过本发明可以准确的识别出维语字符。
技术领域
本发明属于涉及图文处理的技术领域,尤其涉及一种维语图片字符的识别方法及系统。
背景技术
文字,区别于变幻莫测的图像和视频,有着更强的逻辑性和更概括的表达力。随着互联网和移动互联网技术的高速发展,越来越多的新型应用场景需要利用图像中的文字信息。从海量的视频中快速检索出感兴趣的文字,可以极大提高人类的认知效率。
因此,自然场景中的文字提取方法,即从照片或视频中将文字识别出来,即OCR(Optical Character Recognition),光学字符识别,成为了近几年计算机视觉领域的热门研究课题。
在中国大部分地区,人们把汉语作为日常的交流和沟通的工具,而在西北部的新疆,维语的使用频率非常高,在新疆的地方网站上每天都有数以亿计的维语图片在上传和下载,因此迫切需要一种维语图片字符的识别方法及系统以更方便、准确地识别出图片中是否包含维语。
发明内容
有鉴于此,本发明实施例提供一种维语图片字符的识别方法及系统,用以准确、高效地识别图片中的维语字符信息,使得维语图片、文档、书籍等能够迅速走上数字化的道路。
第一方面,本发明实施例提供了一种维语图片字符的识别方法,该识别方法包括:
采集原始图片并对图片中是否包含维语以及维语所在的文本区域进行标记,将标记后的图片作为待训练样本;
将所述待训练样本输入到CNN+BiLSTM模型中以提取待训练样本的特征向量,对所述待训练样本的特征向量进行训练,生成维文文本区域定位网络模型;
将待训练样本中包含维语文本区域的图片输入CNN网络模型,提取所述维语文本区域的特征;将所述维语文本区域的特征输入BiLSTM+CTC网络模型中,获得维语字符序列,并根据所述维语字符序列生成维语字符识别网络模型;
利用维文文本区域定位网络模型识别出待检测图片的维语文本区域;
利用所述维语字符识别网络模型识别出所述待检测图片的维语文本区域中的维语字符。
第二方面,本发明实施例提供了一种维语图片字符的识别系统,该识别系统包括采集模块、区域定位模型生成模块、第一识别模块、字符识别网络模型生成模块和第二识别模块;
所述采集模块用于采集原始图片并对图片中是否包含维语以及维语所在的文本区域进行标记,将标记后的图片作为待训练样本;
所述区域定位模型生成模块将所述待训练样本输入到CNN+BiLSTM模型中以提取待训练样本的特征向量,对所述待训练样本的特征向量进行训练,生成维文文本区域定位网络模型;
所述第一识别模块将待训练样本中包含维语文本区域的图片输入CNN网络模型,提取所述维语文本区域的特征;将所述维语文本区域的特征输入BiLSTM+CTC网络模型中,获得维语字符序列,并根据所述维语字符序列生成维语字符识别网络模型;
所述字符识别网络模型生成模块利用维文文本区域定位网络模型识别出待检测图片的维语文本区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科软科技股份有限公司,未经中科软科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910583713.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文字识别的方法及装置
- 下一篇:水位自动识别方法及装置