[发明专利]一种模型训练方法及系统在审
申请号: | 201810637462.2 | 申请日: | 2018-06-20 |
公开(公告)号: | CN108984629A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 孙亮 | 申请(专利权)人: | 四川斐讯信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 610100 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练模型 训练集数据 模型训练 图像数据 图像数据输入 人工工作量 准确度 爬虫 迭代更新 项目要求 预设 清洗 筛选 优化 | ||
1.一种模型训练方法,其特征在于,包括:
步骤S1爬取符合预设爬虫条件的图像数据;
步骤S2将所述图像数据输入至初次训练模型,筛选出训练集数据;
步骤S3使用所述训练集数据对所述初次训练模型进行训练,得到最终训练模型。
2.如权利要求1所述的模型训练方法,其特征在于,还包括:
步骤S4当所述最终训练模型的准确度未达到预设准确度阈值时,使用所述最终训练模型更新所述步骤S2中的初次训练模型,并跳转至步骤S1。
3.如权利要求2所述的模型训练方法,其特征在于,所述步骤S2中的未被所述最终训练模型更新的所述初次训练模型是使用典型图片集训练得到。
4.如权利要求1所述的模型训练方法,其特征在于,所述步骤S2具体为:
步骤S21将所述图像数据输入至初次训练模型,得到所述图像数据中每个图片的置信度;
步骤S22筛选出所述置信度位于预设置信度范围的图片作为所述训练集数据。
5.如权利要求1-4任意一项所述的模型训练方法,其特征在于,所述步骤S1具体为:步骤S11根据预设爬虫条件中的主体名称,爬取与所述主体名称相关的所述图像数据。
6.一种模型训练系统,其特征在于,包括:
爬虫模块,用于爬取符合预设爬虫条件的图像数据;
筛选模块,用于将所述图像数据输入至初次训练模型,筛选出训练集数据;
训练模块,用于使用所述训练集数据对所述初次训练模型进行训练,得到最终训练模型。
7.如权利要求6所述的模型训练系统,其特征在于,还包括:
更新模块,用于当所述最终训练模型的准确度未达到预设准确度阈值时,使用所述最终训练模型更新所述筛选模块中的初次训练模型;
所述爬虫模块,当使用所述最终训练模型更新所述筛选模块中的初次训练模型后,所述爬虫模块用于再次爬取符合预设爬虫条件的图像数据。
8.如权利要求7所述的模型训练系统,其特征在于,所述筛选模块中的未被所述最终训练模型更新的所述初次训练模型是使用典型图片集训练得到。
9.如权利要求6所述的模型训练系统,其特征在于,筛选模块具体包括:
置信度子模块,用于将所述图像数据输入至初次训练模型,得到所述图像数据中每个图片的置信度;
筛选子模块,用于筛选出所述置信度位于预设置信度范围的图片作为所述训练集数据。
10.如权利要求6-9任意一项所述的模型训练方法,其特征在于,所述爬虫模块,用于爬取符合预设爬虫条件的图像数据具体为:
所述爬虫模块,用于根据预设爬虫条件中的主体名称,爬取与所述主体名称相关的所述图像数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川斐讯信息技术有限公司,未经四川斐讯信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810637462.2/1.html,转载请声明来源钻瓜专利网。