[发明专利]一种主动学习样本选取方法、系统及计算机可读存储介质有效
申请号: | 202011003427.9 | 申请日: | 2020-09-22 |
公开(公告)号: | CN112101263B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 吕文君;康宇;昌吉;许婷;李婧;李泽瑞 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N20/00 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 汪贵艳 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 主动 学习 样本 选取 方法 系统 计算机 可读 存储 介质 | ||
1.一种主动学习样本选取方法,其特征在于:包括以下步骤:
(1)数据收集:
(1.1)收集基于振动信号的机器人地面分类数据:利用振动传感器和摄像头收集原始数据,让机器人在期望被识别的地面上随机游走,并从振动传感器和摄像头采集振动信号与图像信号,振动与图像信号均有时间戳,其中,振动传感器的采样频率大于1;以及
收集基于测井曲线的岩性识别数据:利用测井设备收集测井曲线;
在构造训练集时,收集振动信号,并提取振动帧并转化为样本x,或者 利用测井设备收集测井曲线,每个深度上的测井值组成一个样本x,得到样本集合即为源域样本集合;对源域样本集合进行标注,源域样本的岩性标签分别为则标注矩阵以y表示地面类型的标签或一个岩性标签,则c表示地面类型的数量或岩性种类的数量,c为正整数;y为独热编码,如果样本x为第h类,h∈{1,2,…,c},则y的第h个元素为1且其余元素均为0;
在构造测试集时,收集振动信号,并提取振动帧并转化为样本或者利用测井设备收集测井曲线,每个深度上的测井值组成一个样本得到样本集合即为目标域样本集合;
(1.2)分别收集源域数据、目标域数据,得到源域样本集合和目标域的样本集合其中,ns与nt分别表示源域样本集合与目标域样本集合的样本数量,ns与nt为正整数;源域、目标域样本集合中的样本维度相同,则d表示样本x,的特征数,d为正整数,表示实数域;
对源域样本集合进行标注,源域样本的标签分别为则标注矩阵以y表示一个标签,则c表示分类任务目标类别数量,c为正整数;
y为独热编码,如果样本x为第h类,h∈{1,2,…,c},则y的第h个元素为1且其余元素均为0;
(2)系统初始化:
手动设定以下系数:经验损失系数γ,分歧系数λ,隐层神经元数量k,样本选取数量K;初始化为零矩阵,其中,βi为第i个基分类器的输出权重矩阵,i=1,2,…,m,m为正整数;
设定学习步数Step初始化为零,最大学习步数MaxStep为一个大于1的正整数;
(3)生成隐藏输出矩阵:
采用随机映射方式,分别生成Hs、Ht矩阵,其中
上式中,Hs表示源域的隐藏输出矩阵,Ht表示目标域的隐藏输出矩阵;k表示隐层神经元数量,表示实数域;
(4)基分类器交叉优化:
令Step自增1,按下式依次序地计算βi,具体如下:
其中,βi为第i个基分类器的输出权重矩阵,矩阵为适维单位阵;
i=1,2,…,m,m为正整数;
γ为经验损失系数,λ为分歧系数,H′s为源域的隐藏输出矩阵Hs的转置,Y为标注矩阵;集合
(5)判断:当Step大于MaxStep,则执行步骤(6);如果Step小于等于MaxStep,则跳至步骤(4);
(6)目标域样本选择:
计算第i个分类器对目标域样本集合的预测结果,即Pi=Htβi,其中,i=1,2,…,m,m为正整数;
设Pie为Pi的第e行,其中e=1,2,…,nt;
根据计算目标域第e个样本的不确定性指数θe,其中,cov(·)表示求协方差矩阵,‖·‖F表示F范数;
从中按从大到小选取K个θe,并将选取的θe所对应的下标取出得到下标集合则样本集合即为选取的样本集合;
其中K为样本选取数量,为选取出来的样本。
2.根据权利要求1所述的一种主动学习样本选取方法,其特征在于:所述γ、λ为大于0的实数,k、K为大于0的整数。
3.根据权利要求1所述的一种主动学习的样本选取方法,其特征在于:步骤(4)中所述{1,2,…,m}-i表示从由1,2,…,m组成的集合中去除元素i。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011003427.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音识别方法、装置、设备及存储介质
- 下一篇:一种挡风挡雨便于维修的电器柜