[发明专利]深度学习大尺寸图片训练检测算法有效
申请号: | 201810987195.1 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109117892B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 江南;李怡然;张海滨;黄毅标;孔令一;黄超;张贞纯;赖必贵 | 申请(专利权)人: | 国网福建省电力有限公司福州供电公司;国网福建省电力有限公司;厦门亿力吉奥信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350009 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 尺寸 图片 训练 检测 算法 | ||
本发明涉及一种深度学习大尺寸图片训练检测算法。在训练集合VOC中筛选出包含待识别对象的图片,并保存到训练集合VOC中的对应目录中;遍历所有图片对应的标签文件获取对应的分类识别框,识别框用冒泡方式获取待识别对象的最大尺度,同时用冒泡法找出待识别对象的最小尺度;以待识别对象在相应图片中的中心坐标为中心,根据最大尺度W1、H1从相应图片里面截取以W1、H1为最大长宽的图片;将截取的图片及对应的新的标签文件替换原图及原图对应的标签文件保存到训练集合VOC中的对应目录中;将得到的训练集合VOC输入到fpn深度学习网络进行训练。本发明算法可以训练多个尺度,并且可以对大尺寸进行检测,并降低内存消耗。
技术领域
本发明涉及一种深度学习大尺寸图片训练检测算法。
背景技术
opencv 是开源的OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。
Fpn (Feature Pyramid Networks)特征金字塔是在深度学习网络上的一种多尺度提取识别特征的架构。
目前的opencv算法逐步被深度学习算法所取代,但是还有一些领域像车牌识别还是基于opencv的识别技术。Opecv对于大尺寸的识别采用缩小或者采用滑框方式进行识别。
基于深度学习神经元网络的算法对大图片的识别或者训练通常在进入网络后进行缩放,设置最长边或者最短边,受限深度学习的gpu显卡的内存限制通常无法识别或者训练大尺寸原图(5k+)。
opencv算法对于大尺寸识别采取滑框方式,但是对于不同尺度的对象识别没有比较好的处理方法,即无法识别尺寸发生变化的图片。
基于深度学习神经元网络的算法对大图片的识别或者训练通常在进入网络后进行缩小(设置最长边或者最短边),但是受限深度学习的gpu显卡的内存(6g-12g)限制通常无法识别或者训练大尺寸原图(5k+),缩小导致对于细小特征的训练和识别产生问题。特别5k的图片特征在60x60左右,整体缩小到1024x1024后,特征只剩下12*12的区域,特征严重丢失,影响训练和学习。
因此本申请针对以上现有技术的缺陷,特提出一种改造算法,可以训练多个尺度,并且可以对大尺寸进行检测,并降低内存消耗。
发明内容
本发明的目的在于提供一种深度学习大尺寸图片训练检测算法,可以训练多个尺度,并且可以对大尺寸进行检测。
为实现上述目的,本发明的技术方案是:一种深度学习大尺寸图片训练检测算法,包括如下步骤:
步骤S1、在训练集合VOC中筛选出包含待识别对象的图片,以形成包含待识别对象的图片的图片集合,并保存到训练集合VOC中的对应目录中;
步骤S2、包含待识别对象的图片的图片集合中的每一张图片均对应有相应的标签文件,每一个标签文件均包括待识别对象的类别信息、待识别对象在相应图片中的位置信息;遍历所有的标签文件获取对应的分类识别框,识别框用冒泡方式获取待识别对象的最大尺度(W1,H1),同时用冒泡法找出待识别对象的最小尺度(W0,H0);其中:
W1或W0=xmax-xmin
H1或H0=ymax-ymin
式中,(xmin,ymin)(xmax,ymax)分别为待识别对象在相应图片中的左上角坐标、右下角坐标;
步骤S3、计算待识别对象在相应图片中的中心坐标((xmax -xmin)/2,(ymax -ymin)/2));
步骤S4、以待识别对象在相应图片中的中心坐标为中心,根据最大尺度 W1、H1从相应图片里面截取以W1、H1为最大长宽的图片;若截取出来的长宽落到原图外面,则落到原图外面部分补上空白;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网福建省电力有限公司福州供电公司;国网福建省电力有限公司;厦门亿力吉奥信息科技有限公司,未经国网福建省电力有限公司福州供电公司;国网福建省电力有限公司;厦门亿力吉奥信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810987195.1/2.html,转载请声明来源钻瓜专利网。