[发明专利]一种基于深度学习的图像中纸张检测方法在审

申请号：	201711181082.4	申请日：	2017-11-23
公开（公告）号：	CN108022243A	公开（公告）日：	2018-05-11
发明（设计）人：	李世东;苗长龙	申请（专利权）人：	浙江清华长三角研究院
主分类号：	G06T7/11	分类号：	G06T7/11;G06T7/149;G06T7/168;G06T7/70;G06N3/04
代理公司：	嘉兴启帆专利代理事务所(普通合伙) 33253	代理人：	李伊飏
地址：	314000 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习图像纸张检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的图像中纸张检测方法，其特征在于：包括以下步骤：

步骤1：使用端到端的深度卷积网络对输入图像进行检测，得到图像中纸张较为精确的位置信息，并将纸张从原始图像中分割出来，得到纸张分割后的图像；

步骤2：在步骤(1)所得的分割后的图像上通过轮廓检测算法得到其轮廓图像；

步骤3：在步骤(2)所得的轮廓图像上使用多边形拟合算法得到纸张的4个顶点的坐标信息；

步骤4：利用步骤(3)所得的坐标信息将原始图像上的纸张部分进行变换，求得变换矩阵，并一定程度地消除其透视变化；

步骤5：利用步骤(4)所得变换矩阵进行图像变换得到从原始图像中分割出来的纸张的正面图像。

2.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法，其特征在于：所述步骤(1)中端到端的深度卷积网络，包括DeepLab网络和FCN网络，是一种处理图像分割领域的深度卷积网络，可以端到端的对图像进行训练，输入为一张图像并输出原尺寸大小的分割图像，图像中的纸张检测问题属于两分类的语义分割问题。

3.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法，其特征在于：所述步骤(1)中的纸张分割后的图像是一幅二值图像，所述步骤(2)中使用轮廓检测算法可以得到该二值图像的轮廓信息，并将轮廓点按照顺时针储存在一个向量中。

4.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法，其特征在于：所述步骤(3)中使用多边形拟合算法，包括OpenCV库中的approxPolyDP函数，可以从原始图像的纸张轮廓图像上得到四边形的4个顶点的坐标信息，即纸张4个顶点的坐标信息。

5.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法，其特征在于：所述步骤(4)中变换矩阵的求解过程为：对纸张4个点进行编号，距离图像原点，即(0,0)点，距离最小的点为1号点，剩下三个点按照其在储存轮廓的向量中的先后顺序依次为2、3和4号；计算得出d1为1、2号点之间的位置距离，d2为1、4号点之间的位置距离；最后将1、2、3和4号点依次对应(0,0)、(d1,0)、(d1，d2)和(0，d2)4个坐标点，使用图像变换公式可得出变换矩阵T，由公式：

x y 1 = u v 1 a b c d e f g h i u v 1 T ]]>

表示，其中x和y为变换后的坐标，u和v为原始图像的坐标，T为图像变换矩阵。

6.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法，其特征在于：所述步骤(5)中利用变换矩阵T，可以将原始图像中纸张部分转换得到纸张的正面图像。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江清华长三角研究院，未经浙江清华长三角研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201711181082.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的图像中纸张检测方法在审

专利文献下载