[发明专利]一种基于深度学习的训练数据获取方法和系统在审
申请号: | 202110953717.8 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113657581A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 刘杰;唐权斌;陈思;邱旭之;陈雨梦;杨培丽;朱道远 | 申请(专利权)人: | 长飞光纤光缆股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 430074 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 训练 数据 获取 方法 系统 | ||
本发明公开了一种基于深度学习的训练数据获取方法,包括:获取样本数据,对得到的样本数据进行预处理操作,以得到预处理后的样本数据,将预处理后的样本数据输入训练好的DCGAN模型中,以得到输出结果作为最终的训练数据。本发明能够解决现有工业互联网标识解析系统中,由于标签数据数量过于庞大且类别众多,导致用于训练用的标签数据采集困难的技术问题,以及采集大量数据会增加人力成本、耗时耗力的技术问题,以及由于采集数据缺乏多样性、冗余度高而导致训练识别模型时出现过拟合的技术问题。
技术领域
本发明属于计算机应用软件领域,更具体地,涉及一种基于深度学习的训练数据获取方法和系统。
背景技术
在工业互联网体系中,网络是基础,而标识是网络的基础,是网络的“身份证”,工业互联网标识解析系统是实现工业全要素、各环节信息互通的关键枢纽;通过给每一个对象赋予标识,并借助工业互联网标识解析系统,就能够实现跨地域、跨行业、跨企业的信息查询和共享。
目前,工业互联网标识解系统是通过条形码、二维码、无线射频识别标签等方式赋予物品唯一的标签。如果需要准确识别该标签,需要借助于一个高效率的的标签识别模型,而实现高效率标签识别模型的关键点,在于采集训练数据,并利用该训练数据对标签识别模型进行训练。
然而,在现有工业互联网标识解析系统中,由于标签数据数量过于庞大且类别众多,会导致用于训练用的标签数据采集困难;另外,采集大量数据会增加人力成本,耗时耗力;此外,现有工业互联网标识解析系统采集的数据缺乏多样性,冗余度高,这会导致训练识别模型时出现过拟合的问题
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于深度学习的训练数据获取方法和系统,其目的在于,解决现有工业互联网标识解析系统中,由于标签数据数量过于庞大且类别众多,导致用于训练用的标签数据采集困难的技术问题,以及采集大量数据会增加人力成本、耗时耗力的技术问题,以及由于采集数据缺乏多样性、冗余度高而导致训练识别模型时出现过拟合的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于深度学习的训练数据获取方法,包括如下步骤:
(1)获取样本数据;
(2)对步骤(1)得到的样本数据进行预处理操作,以得到预处理后的样本数据;
(3)将步骤(2)预处理后的样本数据输入训练好的DCGAN模型中,以得到输出结果作为最终的训练数据。
优选地,步骤(1)中获取样本数据,可以是通过线阵相机对可拍摄物品进行现场采集,并对采集的数据进行分类整理后得到,也可以是利用网络爬虫技术从互联网上爬取可用的标签数据后得到。
优选地,步骤(2)具体为,首先对样本数据中存在的模糊、缺损数据进行数据清洗,然后对数据清洗后的样本数据进行数据裁剪,随后,对数据裁剪后的样本数据进行归一化操作,最后对归一化操作后的样本数据进行扩容操作,以得到预处理后的样本数据。
优选地,DCGAN模型包括彼此连接的生成器网络和判别器网络。
优选地,生成器网络的网络结构如下:
第一层是卷积模块层,其是由卷积层、正则化层以及激活函数组成,输入大小为256*256*3。其中,卷积核大小为3*3,步长为2,输出大小为128*128*64,正则化层的local_size是5,alpha值是0.0001,beta值是0.75,激活函数采用ReLU。
第二层是卷积模块层,其是由卷积层、正则化层以及激活函数组成,输入大小为128*128*64。其中,卷积核大小为3*3,步长为2,输出大小为64*64*128,正则化层的local_size是5,alpha值是0.0001,beta值是0.75,激活函数采用ReLU。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长飞光纤光缆股份有限公司,未经长飞光纤光缆股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110953717.8/2.html,转载请声明来源钻瓜专利网。