[发明专利]模型的训练方法、处理器和存储装置在审
申请号: | 201910578052.X | 申请日: | 2019-06-28 |
公开(公告)号: | CN112149704A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 刘若鹏;栾琳;季春霖;刘康 | 申请(专利权)人: | 杭州光启人工智能研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧引 |
地址: | 310000 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 处理器 存储 装置 | ||
本发明提供一种模型的训练方法,获取初始样本作为当前样本,并获取预设的深度网络模型作为第一深度网络模型后,利用第一深度网络模型对当前样本进行数据清洗,基于数据清洗后的样本训练第二深度网络模型,分别计算两个模型的识别精度,若第一深度网络模型的识别精度不高于第二深度网络模型的识别精度,将第二深度网络模型作为第一深度网络模型,并将数据清洗后的样本作为当前样本,返回执行前述数据清洗,直到第一深度网络模型的识别精度高于第二深度网络模型的识别精度,然后输出第一深度网络模型。通过对样本反复进行数据清洗,本发明提高了深度网络模型的样本的数据质量,从而提高输出的深度网络模型的识别精度。
技术领域
本发明涉及数据处理领域,特别涉及一种模型的训练方法、处理器和存储装置。
背景技术
目前,人脸识别技术作为一种根据人的面部信息进行身份识别的技术,被广泛应用于社会的各个领域。其中,人脸识别技术一般是基于深度网络模型进行的,通过提取输入的图像中的人的面部信息,判断提取的面部信息与预先存储在数据库中的面部信息是否匹配,进而完成身份识别。
现有技术中,训练一个深度网络模型的方法是,给定由多个训练数据构成的训练样本,然后基于训练样本和特定的算法进行训练,最终得到一个深度网络模型。该方法的问题在于,给定的训练样本的数据质量较低,训练样本的数据质量越低,基于该训练样本训练得到的精度就越低。
发明内容
基于上述现有技术的不足,本发明提出一种模型的训练方法,通过提高用于训练深度网络模型的样本的数据质量,提高深度网络模型的识别精度。
为解决上述问题,现提出的方案如下:
一种模型的训练方法,包括:
获取初始样本作为当前样本,并获取预设的初始深度网络模型作为第一深度网络模型;
利用第一深度网络模型对当前样本进行数据清洗,得到数据清洗后的样本;
利用数据清洗后的样本,对第一深度网络模型进行训练得到第二深度网络模型;
计算第一深度网络模型的识别精度和第二深度网络模型的识别精度;
判断第一深度网络模型的识别精度是否高于第二深度网络模型的识别精度;
若第一深度网络模型的识别精度高于第二深度网络模型的识别精度,则输出第一深度网络模型。
在一个实施例中,当判断第一深度网络模型的识别精度中,若第一深度网络模型的识别精度等于或者低于第二深度网络模型的识别精度,将第二深度网络模型赋值于第一深度网络模型,并将数据清洗后的样本作为当前样本,返回执行利用第一深度网络模型对当前样本进行数据清洗,得到数据清洗后的样本。
在一个实施例中,利用第一深度网络模型对当前样本进行数据清洗,得到数据清洗后的样本之前,还包括:
将当前样本划分成N份数据,N是预设的正整数;
其中,利用第一深度网络模型对当前样本进行数据清洗,得到数据清洗后的样本,包括:
选择当前样本的待清洗数据;其中,待清洗数据为当前样本的N份数据中未进行数据清洗的任意一份数据;
对待清洗数据进行数据清洗,得到清洗后的数据;
将清洗后的数据和当前样本的其他数据,组合数据清洗后的样本;其中,当前样本的其他数据为当前样本中除待清洗数据之外的数据。
在一个实施例中,利用数据清洗后的样本,对第一深度网络模型进行训练得到第二深度网络模型,包括:
基于数据清洗后的样本中的已清洗数据对第一深度网络模型进行训练,得到第二深度网络模型;其中,已清洗数据包括数据清洗后的样本中,每一份已经进行数据清洗的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州光启人工智能研究院,未经杭州光启人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910578052.X/2.html,转载请声明来源钻瓜专利网。