[发明专利]多媒体分类模型的构建方法、多媒体分类方法及装置有效
申请号: | 201910922063.5 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110458289B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 陶志奇 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 分类 模型 构建 方法 装置 | ||
本公开关于一种多媒体分类模型的构建方法、多媒体分类方法及装置,属于计算机技术领域。本公开确定可移植的多媒体分类模型的模型结构,并对剪枝后的多媒体分类模型每层上相应通道的特征矩阵进行跨层相加,得到可移植的多媒体分类模型每层上不同通道对应的特征矩阵,根据可移植的多媒体分类模型的模型结构和每层上不同通道对应的特征矩阵,构建可移植的多媒体分类模型。由于本公开中的可移植的多媒体分类模型根据剪枝后的每层上的通道数量进行构建,因而模型中每层的通道数量及每层通道上的特征矩阵相对于剪枝前的多媒体分类模型要少,基于可移植的多媒体分类模型对多媒体资源进行分类时,大大减小了计算量。
本公开要求于2019年06月10日提交的申请号为201910498309.0、发明名称为“基于剪枝的模型构建方法、装置、电子设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本公开中。
技术领域
本公开涉及计算机技术领域,特别涉及一种多媒体分类模型的构建方法、多媒体资源处理方法及装置。
背景技术
深度学习模型作为计算机技术领域研究的热点,可对多媒体资源进行处理,例如,可基于对深度学习模型训练得到的多媒体分类模型进行图像识别、物体检测、文本识别、图像分割、自然语言处理等。通常多媒体分类模型一般较大,运行过程中计算量往往也较大,为了提升多媒体分类模型的运行性能,可对多媒体分类模型进行剪枝操作,得到剪枝后的多媒体分类模型,进而基于剪枝后的多媒体分类模型对多媒体资源进行分类。
目前,相关技术可根据多媒体分类模型每层不同通道上的特征,保留每层不同通道上的重要特征,剪掉每层不同通道上的非重要特征,并对剪掉的特征进行补零操作,进而在原平台基于该剪枝后的多媒体分类模型,对多媒体资源进行分类。
然而,由于剪枝操作后只是将非重要特征剪为0,实际上每层上的通道数量及每个通道对应的特征矩阵并未直接剪掉,在运行时所有的通道及通道上的特征矩阵都参与计算,导致对多媒体资源进行分类的计算量较大,因此,亟需提供一种多媒体分类模型的构建方法。
发明内容
本公开实施例提供了一种多媒体分类模型的构建方法、多媒体分类方法及装置,以减小对多媒体资源进行分类的计算量。所述技术方案如下:
根据本公开实施例的第一方面,提供了一种多媒体分类模型的构建方法,所述方法包括:
获取剪枝后的多媒体分类模型,所述多媒体分类模型根据多媒体资源样本对深度学习模型训练得到、用于对多媒体资源进行分类;
根据剪枝后的多媒体分类模型每层上的通道数量,确定可移植的多媒体分类模型的模型结构;
根据所述剪枝后的多媒体分类模型每层上的通道数量及每层上每个通道的特征矩阵大小,对所述剪枝后的多媒体分类模型每层上相应通道的特征矩阵进行跨层相加,得到所述可移植的多媒体分类模型每层上不同通道对应的特征矩阵,所述剪枝后的多媒体资源分类模型每层上通道数量及每个通道的特征矩阵大小根据剪枝操作时所提取的多媒体资源样本的特征矩阵对多媒体资源样本进行分类的重要程度确定;
根据所述可移植的多媒体分类模型的模型结构和所述可移植的多媒体分类模型每层上不同通道对应的特征矩阵,构建所述可移植的多媒体分类模型。
在本公开的另一个实施例中,所述根据所述剪枝后的多媒体分类模型每层上的通道数量,确定可移植的多媒体分类模型的模型结构,包括:
获取所述剪枝后的多媒体分类模型每层上的输出通道数量;
将所述剪枝后的多媒体分类模型上一层的输出通道数量作为下一层的输入通道数量,得到所述可移植的多媒体分类模型的模型结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910922063.5/2.html,转载请声明来源钻瓜专利网。