[发明专利]一种机器学习的训练数据选择方法有效

专利信息
申请号: 201910222007.0 申请日: 2019-03-22
公开(公告)号: CN109961098B 公开(公告)日: 2022-03-01
发明(设计)人: 李向阳;范阳;张兰 申请(专利权)人: 中国科学技术大学
主分类号: G06K9/62 分类号: G06K9/62;G06N20/00
代理公司: 北京凯特来知识产权代理有限公司 11260 代理人: 郑立明;付久春
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 机器 学习 训练 数据 选择 方法
【权利要求书】:

1.一种机器学习的数据选择方法,其特征在于,包括以下步骤:

步骤1,选定待选择数据的机器学习模型,并获取该机器学习模型对应的训练数据集;

步骤2,从所述训练数据集中随机选出一个数据子集作为策略训练数据集,通过深度强化学习对所述策略训练数据集应用于所述机器学习模型进行若干轮训练,根据训练结果确定与所述机器学习模型匹配的数据选择策略;

该步骤2为:

步骤21,将策略训练数据集分为两个不相交的策略训练子集和策略验证子集;

步骤22,初始化深度强化学习模型的策略函数;

步骤23,以所述策略训练子集作为训练数据,通过所述深度强化学习模型重复进行若干轮深度强化学习训练;

该步骤23包括:

步骤231,初始化所述机器学习模型;

步骤232,用所述策略训练子集训练所述机器学习模型,直到所述机器学习模型停止训练;在所述机器学习模型的每步训练过程中,对于每批次数据,根据深度强化学习模型的输出动作,选定该批次数据中的一部分数据作为所述机器学习模型的输入,并使用策略验证子集,计算出该轮训练对应的奖励函数值;

该步骤232中,深度强化学习模型的输出动作中,包含以下特征中的至少一种:

(1)包含数据的信息的数据特征;所述数据特征中包含数据的信息为:数据的标签类别信息、文本数据句子的长度、文字片段的语法信息、图像数据梯度直方图中的至少一种;

(2)包含反映当前模型训练进度的信息的基本模型特征;

(3)包含当前到达的训练数据对于当前模型的重要性的信息的模型与数据结合的特征;

步骤233,当所述机器学习模型一轮训练结束后,累计计算所述奖励函数值,更新策略函数

步骤24,训练完成后得到与所述机器学习模型匹配的深度强化学习模型的策略函数,该策略函数能为所述机器学习模型选择训练数据;

步骤3,通过确定的所述数据选择策略对所述机器学习模型待输入数据按批次进行选择,将选出的数据用于所述机器学习模型的训练。

2.根据权利要求1所述的机器学习的数据选择方法,其特征在于,所述方法的步骤232中,深度强化学习模型的输出动作为:在所述深度强化学习模型的数据选择任务中,对于一个批次中的每个数据,是选择保留该数据还是丢弃该数据的动作。

3.根据权利要求1所述的机器学习的数据选择方法,其特征在于,

所述基本模型特征中包含反映当前模型训练进度的信息为:当前已训练的批次数量、历史的损失函数的平均值和训练集历史准确率;

所述模型与数据结合的特征中包含当前到达的训练数据对于当前模型的重要性的信息为:模型输出的每一类别的概率、数据的损失函数值和训练数据的间隔值;所述训练数据(x,y)的间隔值的定义为:P(y|x)-maxy′≠yP(y′|x))。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910222007.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top