[发明专利]一种基于深度学习的图像中纸张检测方法在审

专利信息
申请号: 201711181082.4 申请日: 2017-11-23
公开(公告)号: CN108022243A 公开(公告)日: 2018-05-11
发明(设计)人: 李世东;苗长龙 申请(专利权)人: 浙江清华长三角研究院
主分类号: G06T7/11 分类号: G06T7/11;G06T7/149;G06T7/168;G06T7/70;G06N3/04
代理公司: 嘉兴启帆专利代理事务所(普通合伙) 33253 代理人: 李伊飏
地址: 314000 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 图像 纸张 检测 方法
【权利要求书】:

1.一种基于深度学习的图像中纸张检测方法,其特征在于:包括以下步骤:

步骤1:使用端到端的深度卷积网络对输入图像进行检测,得到图像中纸张较为精确的位置信息,并将纸张从原始图像中分割出来,得到纸张分割后的图像;

步骤2:在步骤(1)所得的分割后的图像上通过轮廓检测算法得到其轮廓图像;

步骤3:在步骤(2)所得的轮廓图像上使用多边形拟合算法得到纸张的4个顶点的坐标信息;

步骤4:利用步骤(3)所得的坐标信息将原始图像上的纸张部分进行变换,求得变换矩阵,并一定程度地消除其透视变化;

步骤5:利用步骤(4)所得变换矩阵进行图像变换得到从原始图像中分割出来的纸张的正面图像。

2.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(1)中端到端的深度卷积网络,包括DeepLab网络和FCN网络,是一种处理图像分割领域的深度卷积网络,可以端到端的对图像进行训练,输入为一张图像并输出原尺寸大小的分割图像,图像中的纸张检测问题属于两分类的语义分割问题。

3.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(1)中的纸张分割后的图像是一幅二值图像,所述步骤(2)中使用轮廓检测算法可以得到该二值图像的轮廓信息,并将轮廓点按照顺时针储存在一个向量中。

4.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(3)中使用多边形拟合算法,包括OpenCV库中的approxPolyDP函数,可以从原始图像的纸张轮廓图像上得到四边形的4个顶点的坐标信息,即纸张4个顶点的坐标信息。

5.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(4)中变换矩阵的求解过程为:对纸张4个点进行编号,距离图像原点,即(0,0)点,距离最小的点为1号点,剩下三个点按照其在储存轮廓的向量中的先后顺序依次为2、3和4号;计算得出d1为1、2号点之间的位置距离,d2为1、4号点之间的位置距离;最后将1、2、3和4号点依次对应(0,0)、(d1,0)、(d1,d2)和(0,d2)4个坐标点,使用图像变换公式可得出变换矩阵T,由公式:

x y 1 = u v 1 a b c d e f g h i u v 1 T ]]>

表示,其中x和y为变换后的坐标,u和v为原始图像的坐标,T为图像变换矩阵。

6.根据权利要求1所述的一种基于深度学习的图像中纸张检测方法,其特征在于:所述步骤(5)中利用变换矩阵T,可以将原始图像中纸张部分转换得到纸张的正面图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江清华长三角研究院,未经浙江清华长三角研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711181082.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top