[发明专利]一种神经网络模型的训练集优化方法及系统在审
申请号: | 201810661562.9 | 申请日: | 2018-06-26 |
公开(公告)号: | CN108985344A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 罗培元 | 申请(专利权)人: | 四川斐讯信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 成都硕荟知识产权代理事务所(特殊普通合伙) 51272 | 代理人: | 林晓青 |
地址: | 610100 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练集 神经网络模型 测试集 优化 归一化处理 分类概率 优化训练 文件集 预设 神经网络模型预测 预处理 优化条件 预测结果 原始数据 数据集 准确率 同源 采集 预测 统计 | ||
1.一种神经网络模型的训练集优化方法,其特征在于,包括:
将采集的原始数据按照预设比例分为测试集和训练集;
对所述测试集进行预处理,得到处理后文件集;
对所述处理后文件集中的各文件进行归一化处理;
使用根据所述训练集训练好的神经网络模型预测每个经过归一化处理的文件的分类概率;
根据每个文件的分类概率,按照预设待优化条件进行统计,得到对应的待优化文件集;
对所述待优化文件集中的每个待优化文件进行增广处理,得到作为优化训练集的增广数据集。
2.如权利要求1所述的神经网络模型的训练集优化方法,其特征在于,所述增广处理包括以下任意一种或多种:旋转处理、缩放处理、添加噪声处理和裁剪处理。
3.如权利要求2所述的神经网络模型的训练集优化方法,其特征在于,所述增广数据集包括:待优化文件集中的每个待优化文件对应的处理数据集。
4.如权利要求3所述的神经网络模型的训练集优化方法,其特征在于,所述对待优化文件集中的每个待优化文件进行增广处理中对一个待优化文件进行处理的具体过程为:
对所述待优化文件集中的一个待优化文件分别进行所述增广处理中包括的所有处理,每种处理得到一个对应的增广文件,得到的所有增广文件作为所述待优化文件的处理数据集。
5.如权利要求1-4任意一项所述的神经网络模型的训练集优化方法,其特征在于,所述对测试集进行预处理,得到处理后文件集具体为:
对所述测试集中的所有文件进行文件格式的校验和后缀的校验;
将校验成功的所有文件作为所述处理后文件集;
所述校验成功是指所述文件的文件格式符合预设文件格式条件、且所述文件的后缀与预设后缀一致。
6.如权利要求5所述的神经网络模型的训练集优化方法,其特征在于,所述对测试集中的所有文件进行文件格式的校验和后缀的校验的具体过程为:
遍历所述测试集中的所有文件,将所述文件格式不符合预设文件格式条件的文件删除,将仅后缀不与预设后缀一致的文件的后缀改为预设后缀。
7.一种神经网络模型的训练集优化系统,其特征在于,包括:
数据分类模块,用于将采集的原始数据按照预设比例分为测试集和训练集;
预处理模块,用于对所述测试集进行预处理,得到处理后文件集;
归一化处理模块,用于对所述处理后文件集中的各文件进行归一化处理;
概率预测模块,用于使用根据所述训练集训练好的神经网络模型预测每个经过归一化处理的文件的分类概率;
待优化统计模块,用于根据每个文件的分类概率,按照预设待优化条件进行统计,得到对应的待优化文件集;
增广处理模块,用于对所述待优化文件集中的每个待优化文件进行增广处理,得到作为优化训练集的增广数据集。
8.如权利要求7所述的神经网络模型的训练集优化系统,其特征在于,所述增广处理包括以下任意一种或多种:旋转处理、缩放处理、添加噪声处理和裁剪处理。
9.如权利要求8所述的神经网络模型的训练集优化系统,其特征在于,所述增广数据集包括:待优化文件集中的每个待优化文件对应的处理数据集。
10.如权利要求9所述的神经网络模型的训练集优化系统,其特征在于,所述增广处理模块,用于对所述待优化文件集中的每个待优化文件进行增广处理中对一个待优化文件进行处理的具体过程为:
所述增广处理模块,用于对所述待优化文件集中的一个待优化文件分别进行所述增广处理中包括的所有处理,每种处理得到一个对应的增广文件,得到的所有增广文件作为所述待优化文件的处理数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川斐讯信息技术有限公司,未经四川斐讯信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810661562.9/1.html,转载请声明来源钻瓜专利网。