[发明专利]一种基于深度学习的训练数据获取方法和系统在审

专利信息
申请号: 202110953717.8 申请日: 2021-08-19
公开(公告)号: CN113657581A 公开(公告)日: 2021-11-16
发明(设计)人: 刘杰;唐权斌;陈思;邱旭之;陈雨梦;杨培丽;朱道远 申请(专利权)人: 长飞光纤光缆股份有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 武汉臻诚专利代理事务所(普通合伙) 42233 代理人: 宋业斌
地址: 430074 湖北省*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 训练 数据 获取 方法 系统
【说明书】:

发明公开了一种基于深度学习的训练数据获取方法,包括:获取样本数据,对得到的样本数据进行预处理操作,以得到预处理后的样本数据,将预处理后的样本数据输入训练好的DCGAN模型中,以得到输出结果作为最终的训练数据。本发明能够解决现有工业互联网标识解析系统中,由于标签数据数量过于庞大且类别众多,导致用于训练用的标签数据采集困难的技术问题,以及采集大量数据会增加人力成本、耗时耗力的技术问题,以及由于采集数据缺乏多样性、冗余度高而导致训练识别模型时出现过拟合的技术问题。

技术领域

本发明属于计算机应用软件领域,更具体地,涉及一种基于深度学习的训练数据获取方法和系统。

背景技术

在工业互联网体系中,网络是基础,而标识是网络的基础,是网络的“身份证”,工业互联网标识解析系统是实现工业全要素、各环节信息互通的关键枢纽;通过给每一个对象赋予标识,并借助工业互联网标识解析系统,就能够实现跨地域、跨行业、跨企业的信息查询和共享。

目前,工业互联网标识解系统是通过条形码、二维码、无线射频识别标签等方式赋予物品唯一的标签。如果需要准确识别该标签,需要借助于一个高效率的的标签识别模型,而实现高效率标签识别模型的关键点,在于采集训练数据,并利用该训练数据对标签识别模型进行训练。

然而,在现有工业互联网标识解析系统中,由于标签数据数量过于庞大且类别众多,会导致用于训练用的标签数据采集困难;另外,采集大量数据会增加人力成本,耗时耗力;此外,现有工业互联网标识解析系统采集的数据缺乏多样性,冗余度高,这会导致训练识别模型时出现过拟合的问题

发明内容

针对现有技术的以上缺陷或改进需求,本发明提供了一种基于深度学习的训练数据获取方法和系统,其目的在于,解决现有工业互联网标识解析系统中,由于标签数据数量过于庞大且类别众多,导致用于训练用的标签数据采集困难的技术问题,以及采集大量数据会增加人力成本、耗时耗力的技术问题,以及由于采集数据缺乏多样性、冗余度高而导致训练识别模型时出现过拟合的技术问题。

为实现上述目的,按照本发明的一个方面,提供了一种基于深度学习的训练数据获取方法,包括如下步骤:

(1)获取样本数据;

(2)对步骤(1)得到的样本数据进行预处理操作,以得到预处理后的样本数据;

(3)将步骤(2)预处理后的样本数据输入训练好的DCGAN模型中,以得到输出结果作为最终的训练数据。

优选地,步骤(1)中获取样本数据,可以是通过线阵相机对可拍摄物品进行现场采集,并对采集的数据进行分类整理后得到,也可以是利用网络爬虫技术从互联网上爬取可用的标签数据后得到。

优选地,步骤(2)具体为,首先对样本数据中存在的模糊、缺损数据进行数据清洗,然后对数据清洗后的样本数据进行数据裁剪,随后,对数据裁剪后的样本数据进行归一化操作,最后对归一化操作后的样本数据进行扩容操作,以得到预处理后的样本数据。

优选地,DCGAN模型包括彼此连接的生成器网络和判别器网络。

优选地,生成器网络的网络结构如下:

第一层是卷积模块层,其是由卷积层、正则化层以及激活函数组成,输入大小为256*256*3。其中,卷积核大小为3*3,步长为2,输出大小为128*128*64,正则化层的local_size是5,alpha值是0.0001,beta值是0.75,激活函数采用ReLU。

第二层是卷积模块层,其是由卷积层、正则化层以及激活函数组成,输入大小为128*128*64。其中,卷积核大小为3*3,步长为2,输出大小为64*64*128,正则化层的local_size是5,alpha值是0.0001,beta值是0.75,激活函数采用ReLU。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长飞光纤光缆股份有限公司,未经长飞光纤光缆股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110953717.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top