[发明专利]一种面向数据驱动建模的主动学习方法在审
申请号: | 201910332775.1 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110070131A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 刘宏刚;李峰;刘红丽 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基准分类 预测结果 不确定性 阈值条件 训练集 剩余样本 数据驱动 主动学习 建模 排序 样本 经济成本 随机选择 选择功能 循环重复 训练样本 比对 响应 预测 | ||
1.一种面向数据驱动建模的主动学习方法,其特征在于,包括以下步骤:
1)从训练集中随机选择K个样本构成初始训练集,并利用所述初始训练集对基准分类器训练;
2)利用训练后的所述基准分类器对所述训练集中剩余样本进行预测得到预测结果,并与阈值条件比对;
3)响应于预测结果不满足所述阈值条件,基于所述预测结果计算所述基准分类器对所述剩余样本的不确定性,并将所述不确定性由高到低排序;
4)将所述排序中不确定性最高的前N个样本加入到所述初始训练集中;
5)利用所述初始训练集对所述基准分类器训练;
6)循环重复步骤2)到5),直到在步骤2)的预测结果满足所述阈值条件。
2.根据权利要求1所述的方法,其特征在于,所述基准分类器包括CNN网络模型。
3.根据权利要求1所述的方法,其特征在于,基于所述预测结果计算所述基准分类器对所述剩余样本的不确定性包括:利用熵确定所述不确定性的高低。
4.根据权利要求3所述的方法,其特征在于,所述熵的计算公式为:
其中P(yj|xi)表示xi属于第j类的可能性。
5.根据权利要求1所述的方法,其特征在于,所述主动学习方法用于地震波数据的初至拾取。
6.根据权利要求1所述的方法,其特征在于,所述K与所述N数值相等。
7.根据权利要求1所述的方法,其特征在于,预测结果满足所述阈值条件包括:所述基准分类器的性能提升与继续学习成本的比值达到设定条件。
8.根据权利要求1所述的方法,其特征在于,还包括输出每一次预测结果的步骤。
9.一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如权利要求1-8任意一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行权利要求1-8任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910332775.1/1.html,转载请声明来源钻瓜专利网。