[发明专利]一种可以识别新类的磨粒分类模型与方法有效
申请号: | 202010526027.X | 申请日: | 2020-06-11 |
公开(公告)号: | CN111428823B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 张桃红;范素丽;曾庆峰 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可以 识别 分类 模型 方法 | ||
1.一种可以识别新类的磨粒分类方法,其特征在于,包括:
构建可以识别新类的磨粒分类模型;
获取磨粒图像数据集,将所述磨粒图像数据集划分为训练集和测试集;其中所述测试集包括的磨粒的类别数大于所述训练集包括的磨粒的类别数;
使用划分的训练集训练磨粒分类模型,使磨粒分类模型具有提取不同类别的类中心向量的能力,利用磨粒分类模型在测试集上生成新类的类中心向量,从而获得对新类的识别能力;其中,新类为在所述训练集中未出现的磨粒类别;
将待分类磨粒图像输入到训练好的磨粒分类模型,得到磨粒类型分类结果;
其中,所述磨粒分类模型包括:
特征向量提取阶段网络,用于提取磨粒图像的特征向量;
类中心向量提取阶段网络,用于基于所述特征向量提取阶段网络提取的特征向量,提取磨粒的类中心向量;其中,在训练过程中,类中心向量提取阶段网络可学习到如何提取不同磨粒类别的类中心向量;在测试过程中,类中心向量提取阶段网络可提取出之前未在训练集中出现过的磨粒类别的类中心向量;
预测阶段网络,用于结合所述特征向量提取阶段网络和所述类中心向量提取阶段网络的输出,对当前待预测的磨粒图像中的磨粒的类型进行预测;
其中,所述特征向量提取阶段网络的网络结构包括:
Conv1层:该层为卷积层,卷积核大小为3*3,卷积深度为24;
MaxPool层:该层为最大池化层;
stage2层:该层为1个down sampling unit和3个basic unit的堆叠;
stage3层:该层为1个down sampling unit和7个basic unit的堆叠;
stage4层:该层为1个down sampling unit和3个basic unit的堆叠;
Conv5层:该层为卷积层,卷积核大小为1*1,卷积深度为1024;
F6层:该层为全连接层,输出通道数为1024;
F7层:该层为全连接层,输出通道数为1024;
F8层:该层为全连接层,输出通道数为512;
F9层:该层为全连接层,输出通道数为256;
其中,down sampling unit和basic unit是由卷积Conv、批量归一化BN和ReLU激活函数构成的两个卷积块;
所述类中心向量提取阶段网络具体用于:
利用基于距离度量的类中心向量提取算法,根据磨粒图像经过所述特征向量提取阶段网络的F9层得到的特征向量,从中提取出预设数量的类中心向量;
所述类中心向量提取阶段网络提取磨粒的类中心向量的过程包括:
步骤一、在所述特征向量提取阶段网络提取到的特征向量中选择三个作为初始类中心向量;
步骤二、计算其他特征向量到三个类中心向量的距离,将其他特征向量归为距离最小的类中心向量所属的类,形成三个簇;
步骤三、分别计算三个簇的均值向量作为新的三个类中心向量;
步骤四、重复执行步骤二和步骤三,直到三个簇稳定为止,此时的三个类中心向量就是当前磨粒对应的类中心向量;
所述磨粒分类模型的训练过程包括:
步骤一、第一个batch,在训练集中随机选取N1类,每类选m张图像,将N1*m张图像作为该batch的代表集,将该N1类剩余的磨粒图像作为对比集;
步骤二、将代表集输入到特征向量提取阶段网络,得到特征向量;再经过类中心向量提取阶段网络计算出每类的类中心向量;
步骤三、依次将对比集中的图像输入到特征向量提取阶段网络,得到对比图像的特征向量;再经过预测阶段网络,根据损失函数计算出每个对比集中的磨粒图像的损失,进而得到该batch的损失,在最小化损失和随机梯度算法的作用下,更新一次磨粒分类模型的网络参数;
步骤四、进行下一个batch的训练,重复步骤一、步骤二和步骤三,直至达到预设的最大迭代次数;
其中,所述磨粒分类模型的训练过程中的损失函数的定义为:
交叉熵损失:
距离损失:
磨粒分类模型的总损失函数:Loss=LCE+L(XoutputC);
其中,dij(Xoutput)代表Xoutput与第i类的第j个类中心向量Cij之间的距离,ir表示Xoutput的真实类别;f(·)表示ReLU激活函数;N代表磨粒图像的总类数,Ci代表第i类磨粒,yi代表待分类磨粒图像是否属于第i类磨粒,值为1表示是,值为0表示不是;p(Ci|Xoutput)代表Xoutput属于第i类磨粒的概率;C代表所有的类中心向量;λ代表Xoutput到其所属类的最接近类中心向量的距离与Xoutput到其非所属类的最接近类中心向量的距离之间的差值;
所述预测阶段网络对磨粒类型的预测过程包括:
步骤一、由特征向量提取阶段网络的F9层得到待分类磨粒图像的特征向量Xoutput,计算Xoutput和第i类的第j个类中心向量Cij的距离dij(Xoutput);
步骤二、假设每类都服从高斯分布,根据dij(Xoutput)计算待分类磨粒图像属于第i类的第j个中心向量的概率pij(Xoutput);
步骤三、根据pij(Xoutput)计算出待分类磨粒图像属于每一类磨粒的概率;
步骤四、基于待分类磨粒图像属于每一类磨粒的概率,输出待分类磨粒图像的分类结果。
2.如权利要求1所述的可以识别新类的磨粒分类方法,其特征在于,所述将所述磨粒图像数据集划分为训练集和测试集,包括:
将所述磨粒图像数据集按照8∶2的比例分层采样,划分为训练集和测试集;
将训练集中所有图像均按照5∶5的比例分层采样,划分为对比集和代表集;将测试集中旧类图像均划分入对比集,新类图像按照5∶5的比例划分为对比集和代表集;其中,代表集用于生成新类与旧类的类中心向量并将该类中心向量作为类预测的基准,实现对新类的预测;对比集用于计算损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010526027.X/1.html,转载请声明来源钻瓜专利网。