[发明专利]模型迭代训练方法及装置在审
申请号: | 201811324203.0 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109669964A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 张敏 | 申请(专利权)人: | 建湖云飞数据科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62 |
代理公司: | 南京常青藤知识产权代理有限公司 32286 | 代理人: | 金迪 |
地址: | 224000 江苏省盐城市建湖县高新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种模型迭代训练方法,包括:在第一样本库中选取第一迭代负面样本,所述第一迭代负面样本为第一样本库中除第一迭代正例样本之外的其余样本;在所述第一迭代正面样本中随机选取第一数量的第一测试样本,在所述第一迭代负面样本中随机选取第二数量的第二测试样本,根据所述第一数量的第一测试样本以及第二数量的第二测试样本对待训练模型进行模型训练,得到第一迭代训练模型,如此迭代训练,通过不断增加正样本数量提升了负样本的清洁度,如此而训练得到的分类模型稳定性较好。 | ||
搜索关键词: | 迭代 测试样本 迭代训练 样本 随机选取 样本库 清洁度 分类模型 模型训练 训练模型 正例样本 负样本 正样本 | ||
【主权项】:
1.一种模型迭代训练方法,其特征在于,所述方法包括:在第一样本库中选取第一迭代负面样本,所述第一迭代负面样本为第一样本库中除第一迭代正例样本之外的其余样本;在所述第一迭代正面样本中随机选取第一数量的第一测试样本,在所述第一迭代负面样本中随机选取第二数量的第二测试样本,所述第一数量与第二数量相等;根据所述第一数量的第一测试样本以及第二数量的第二测试样本对待训练模型进行模型训练,得到第一迭代训练模型;采用所述第一迭代训练模型对第二样本库进行分类测试,当测试结果不符合预定要求时,利用所述第一迭代训练模型对第一样本库进行分类,根据所述分类结果,在第一样本库中确定第二迭代预测正面样本,对于第二迭代预测正面样本中的所有样本,分别确定其被分类为正例样本的可能性值,在所述第二迭代预测正面样本中选取被分类为正例样本的可能性值最高的预设数目个样本,将所述预设数目个样本确定为第二特殊正面样本;将所述第一迭代正面样本和所述第二特殊正面样本确定为第二迭代正面样本,确定所述第一样本库中除所述第二迭代正面样本外的其余样本第二迭代正面样本为第二迭代负面样本;根据所述第二迭代正面样本和所述第二迭代负面样本,对所述第一迭代训练模型进行迭代训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建湖云飞数据科技有限公司,未经建湖云飞数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811324203.0/,转载请声明来源钻瓜专利网。