[发明专利]深度学习大尺寸图片训练检测算法有效
申请号: | 201810987195.1 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109117892B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 江南;李怡然;张海滨;黄毅标;孔令一;黄超;张贞纯;赖必贵 | 申请(专利权)人: | 国网福建省电力有限公司福州供电公司;国网福建省电力有限公司;厦门亿力吉奥信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350009 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种深度学习大尺寸图片训练检测算法。在训练集合VOC中筛选出包含待识别对象的图片,并保存到训练集合VOC中的对应目录中;遍历所有图片对应的标签文件获取对应的分类识别框,识别框用冒泡方式获取待识别对象的最大尺度,同时用冒泡法找出待识别对象的最小尺度;以待识别对象在相应图片中的中心坐标为中心,根据最大尺度W1、H1从相应图片里面截取以W1、H1为最大长宽的图片;将截取的图片及对应的新的标签文件替换原图及原图对应的标签文件保存到训练集合VOC中的对应目录中;将得到的训练集合VOC输入到fpn深度学习网络进行训练。本发明算法可以训练多个尺度,并且可以对大尺寸进行检测,并降低内存消耗。 | ||
搜索关键词: | 深度 学习 尺寸 图片 训练 检测 算法 | ||
【主权项】:
1.一种深度学习大尺寸图片训练检测算法,其特征在于,包括如下步骤:步骤S1、在训练集合VOC中筛选出包含待识别对象的图片,以形成包含待识别对象的图片的图片集合,并保存到训练集合VOC中的对应目录中;步骤S2、包含待识别对象的图片的图片集合中的每一张图片均对应有相应的标签文件,每一个标签文件均包括待识别对象的类别信息、待识别对象在相应图片中的位置信息;遍历所有的标签文件获取对应的分类识别框,识别框用冒泡方式获取待识别对象的最大尺度(W1,H1),同时用冒泡法找出待识别对象的最小尺度(W0,H0);其中:W1或W0=xmax‑xminH1或H0=ymax‑ymin式中,(xmin,ymin)(xmax,ymax)分别为待识别对象在相应图片中的左上角坐标、右下角坐标;步骤S3、计算待识别对象在相应图片中的中心坐标((xmax ‑xmin)/2,(ymax ‑ymin)/2));步骤S4、以待识别对象在相应图片中的中心坐标为中心,根据最大尺度 W1、H1从相应图片里面截取以W1、H1为最大长宽的图片;若截取出来的长宽落到原图外面,则落到原图外面部分补上空白;步骤S5、截取的图片以原图为参照,将待识别对象求出的新的xmin,ymin,xmax,ymax 写到新的标签文件中,同时将截取的图片及对应的新的标签文件替换原图及原图对应的标签文件保存到训练集合VOC中的对应目录中;步骤S6、将步骤S5得到的训练集合VOC输入到fpn深度学习网络进行训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网福建省电力有限公司福州供电公司;国网福建省电力有限公司;厦门亿力吉奥信息科技有限公司,未经国网福建省电力有限公司福州供电公司;国网福建省电力有限公司;厦门亿力吉奥信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810987195.1/,转载请声明来源钻瓜专利网。