[发明专利]分类模型的训练、对象分类方法及装置有效
申请号: | 202010276683.9 | 申请日: | 2020-04-10 |
公开(公告)号: | CN111178458B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 曹绍升 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张明;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 对象 方法 装置 | ||
本说明书实施例提供一种分类模型的训练、对象分类方法及装置,在训练方法中,获取带分类标签的样本。在嵌入层中,确定样本的特征向量以及分类标签的标签向量。在卷积层中,基于若干不同宽度的卷积窗口,对样本的特征向量进行多次卷积处理,得到多个卷积结果。在池化层中,计算各卷积结果与分类标签的标签向量之间的相似度,并基于计算得到的相似度,确定对应于各卷积结果的注意力权重值。基于对应于各卷积结果的注意力权重值,对各卷积结果进行加权平均池化操作,得到池化结果。将池化结果作为样本的样本表示向量,并至少基于样本表示向量以及分类标签的标签向量,确定预测损失。基于预测损失,调整分类模型的参数。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种分类模型的训练、对象分类方法及装置。
背景技术
对象分类是指通过预先训练的分类模型,预测待分类对象属于特定分类体系下各个特定类别中哪个类别。这里的分类模型例如可以为卷积神经网络等,该卷积神经网络可以包括卷积层和池化层等。
以分类模型为卷积神经网络为例来说,在传统的模型训练方法中,在卷积层,会通过卷积操作从样本中提取局部特征。在池化层,会通过最大池化或者平均池化操作从局部特征中提取全局特征。然而,由于最大池化会加强样本的局部特征,但这部分特征可能并非是与对象分类相关的重要信息。此外,平均池化会冲淡有效特征。因此,基于传统的训练方法往往不能从样本中提取到有效的全局特征,进而会影响所训练得到的分类模型的精度。
有鉴于此,希望能有改进的方案,可以提升分类模型的精度,进而可以实现对象的有效分类。
发明内容
本说明书一个或多个实施例描述了一种分类模型的训练、对象分类方法及装置,可以提升模型精度,进而可以实现对象的有效分类。
第一方面,提供了一种分类模型的训练方法,包括:
获取带分类标签的样本;
在所述嵌入层中,确定所述样本的特征向量以及所述分类标签的标签向量;
在所述卷积层中,基于若干不同宽度的卷积窗口,对所述样本的特征向量进行多次卷积处理,得到多个卷积结果;
在所述池化层中,计算所述多个卷积结果中各卷积结果与所述分类标签的标签向量之间的相似度;并基于计算得到的相似度,确定对应于所述各卷积结果的注意力权重值;基于对应于所述各卷积结果的注意力权重值,对所述各卷积结果进行加权平均池化操作,得到池化结果;
将所述池化结果作为所述样本的样本表示向量,并至少基于所述样本表示向量以及所述分类标签的标签向量,确定预测损失;
基于所述预测损失,调整所述分类模型的参数。
第二方面,提供了一种对象分类方法,包括:
获取待分类对象以及若干预定类别;
将所述若干预定类别中的每个类别依次作为当前类别,基于当前类别进行相似度计算,所述相似度计算包括:
在所述嵌入层中,确定所述待分类对象的初始表示向量以及所述当前类别的类别向量;
在所述卷积层中,基于若干不同宽度的卷积窗口,对所述初始表示向量进行多次卷积处理,得到多个卷积结果;
在所述池化层中,计算所述多个卷积结果中各卷积结果与所述当前类别的类别向量之间的相似度;并基于计算得到的相似度,确定对应于所述各卷积结果的注意力权重值;基于对应于所述各卷积结果的注意力权重值,对所述各卷积结果进行加权平均池化操作,得到池化结果;
将所述池化结果作为所述待分类对象的最终表示向量,并计算所述最终表示向量与所述当前类别的类别向量之间的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010276683.9/2.html,转载请声明来源钻瓜专利网。