[发明专利]一种基于深度学习的图像中纸张检测方法在审
申请号: | 201711181082.4 | 申请日: | 2017-11-23 |
公开(公告)号: | CN108022243A | 公开(公告)日: | 2018-05-11 |
发明(设计)人: | 李世东;苗长龙 | 申请(专利权)人: | 浙江清华长三角研究院 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/149;G06T7/168;G06T7/70;G06N3/04 |
代理公司: | 嘉兴启帆专利代理事务所(普通合伙) 33253 | 代理人: | 李伊飏 |
地址: | 314000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 纸张 检测 方法 | ||
1.一种基于深度学习的图像中纸张检测方法,其特征在于:包括以下步骤:
步骤1:使用端到端的深度卷积网络对输入图像进行检测,得到图像中纸张较为精确的位置信息,并将纸张从原始图像中分割出来,得到纸张分割后的图像;
步骤2:在步骤(1)所得的分割后的图像上通过轮廓检测算法得到其轮廓图像;
步骤3:在步骤(2)所得的轮廓图像上使用多边形拟合算法得到纸张的4个顶点的坐标信息;
步骤4:利用步骤(3)所得的坐标信息将原始图像上的纸张部分进行变换,求得变换矩阵,并一定程度地消除其透视变化;
步骤5:利用步骤(4)所得变换矩阵进行图像变换得到从原始图像中分割出来的纸张的正面图像。
2.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(1)中端到端的深度卷积网络,包括DeepLab网络和FCN网络,是一种处理图像分割领域的深度卷积网络,可以端到端的对图像进行训练,输入为一张图像并输出原尺寸大小的分割图像,图像中的纸张检测问题属于两分类的语义分割问题。
3.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(1)中的纸张分割后的图像是一幅二值图像,所述步骤(2)中使用轮廓检测算法可以得到该二值图像的轮廓信息,并将轮廓点按照顺时针储存在一个向量中。
4.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(3)中使用多边形拟合算法,包括OpenCV库中的approxPolyDP函数,可以从原始图像的纸张轮廓图像上得到四边形的4个顶点的坐标信息,即纸张4个顶点的坐标信息。
5.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(4)中变换矩阵的求解过程为:对纸张4个点进行编号,距离图像原点,即(0,0)点,距离最小的点为1号点,剩下三个点按照其在储存轮廓的向量中的先后顺序依次为2、3和4号;计算得出d1为1、2号点之间的位置距离,d2为1、4号点之间的位置距离;最后将1、2、3和4号点依次对应(0,0)、(d1,0)、(d1,d2)和(0,d2)4个坐标点,使用图像变换公式可得出变换矩阵T,由公式:
表示,其中x和y为变换后的坐标,u和v为原始图像的坐标,T为图像变换矩阵。
6.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(5)中利用变换矩阵T,可以将原始图像中纸张部分转换得到纸张的正面图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江清华长三角研究院,未经浙江清华长三角研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711181082.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于智能桌的充电系统
- 下一篇:圆柱形动力电池组合用金属框架结构
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序