[发明专利]一种自然场景下证件图像的文本检测方法有效
申请号: | 201710854505.8 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107609549B | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 张楠;靳晓宁;张文文;段禹心;贺思源 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种自然场景下证件图像的文本检测方法:选取常用汉字制造汉字图片,形成数据集1,对标注好的证件图像进行随机的旋转、裁剪操作,再用泊松克隆的方式融合不同背景图,形成数据集2;采用数据集1对VGG16网络进行文字分类模型的训练,待模型收敛后,用得到的参数初始化全卷积神经网络模型,并用数据集2训练模型;用训练好的全卷积神经网络模型处理图像,根据最大概率的方法得到每个像素点的分类情况,形成文本‑非文本二值图;用连通区域的方法得到文本的区域将原图像二值化,仅提取文本‑非文本区域二值图中文本区域内的文字信息,得到文本二值图;通过最大方差方法矫正图像;对矫正后图像再次投影,精修文本‑非文本区域二值图。 | ||
搜索关键词: | 一种 自然 场景 证件 图像 文本 检测 方法 | ||
【主权项】:
一种自然场景下证件图像的文本检测方法,其特征在于,包括以下步骤:步骤1、建立训练数据集:选取常用汉字,采用不同字体类型制造汉字图片,形成数据集1,其中,数据集1中训练图像为不同字体类型的汉字,标签为对应汉字的指定标号;步骤2、对标注好的证件图像进行随机的旋转、裁剪、模糊、反转、变换明暗度、gamma变换等操作,再用泊松克隆的方式融合不同背景图,形成数据集2,其中,数据集2中训练图像为文本图像,标签为对应大小的文本‑非文本二值图;步骤3、采用数据集1对VGG16(Visual Geometry Group‑16Net)网络进行文字分类模型的训练,待模型收敛后,去除VGG16网络的全连接层,改为全卷积神经网络(FCN,Fully Convolutional Networks),用得到的VGG16文字分类模型参数初始化全卷积神经网络模型,并采用数据集2训练全卷积神经网络模型;步骤4、采用训练好的全卷积神经网络模型处理图像,得到文本‑非文本概率分布图,通过最大概率的方法得到每个像素点的分类情况,形成文本‑非文本二值图;步骤5、根据文本‑非文本区域二值图,用连通区域的方法得到文本的区域;步骤6、将原图像二值化,仅提取步骤5中文本‑非文本区域二值图中文本区域内的文字信息,得到文本二值图;步骤7、将步骤6得到的文本图像旋转不同角度,横向投影,通过最大方差的方法矫正图像;步骤8、对矫正后的图像再次投影,根据区域横(纵)像素点个数,判断此区域的横/纵并分割文字行,精修步骤5中得到的文本‑非文本区域二值图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710854505.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种钢坯号扫描装置
- 下一篇:一种用于低净空桥梁图像采集装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序