[发明专利]零样本学习的图像分类方法、装置及电子设备在审
申请号: | 202010523205.3 | 申请日: | 2020-06-10 |
公开(公告)号: | CN111738316A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 郭冠军 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/38;G06N3/04 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 陈龙 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 学习 图像 分类 方法 装置 电子设备 | ||
本公开实施例中提供了一种零样本学习的图像分类方法、装置及电子设备,属于数据处理技术领域,该方法包括:获取多个内容各不相同的原始图像以及与所述原始图像对应的变换图像,所述变换图像通过对所述原始图像进行相似变化得到;基于所述原始图像和所述变换图像,对预设的神经网络模型进行特征训练,以使得所述神经网络模型满足特征计算性能要求;获取目标用户在客户端指定的分类图像以及所述分类图像的分类名称;通过所述神经网络模型计算待分类图像与所述分类图像之间的特征距离是否满足预设的特征距离值,确定所述待分类图像是否与所述分类图像具有相同的类别及分类名称。通过本公开的处理方案,能够提高图像分类标注的效率。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种零样本学习的图像分类方法、装置及电子设备。
背景技术
图像分类是指根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。
通过神经网络来进行图像分类,得到快速的发展。然而,在通过神经网络模型进行图像分类的过程中,通常需要进行大量的训练样本,对于智能手机等移动端设备而言,这种分类方式无法有效的进行,这是因为移动端设备通常无法提供样本训练所需要的系统资源。从而影响了移动端的图像分类的效率。
发明内容
有鉴于此,本公开实施例提供一种零样本学习的图像分类方法、装置及电子设备,以至少部分解决现有技术中存在的问题。
第一方面,本公开实施例提供了一种零样本学习的图像分类方法,包括:
获取多个内容各不相同的原始图像以及与所述原始图像对应的变换图像,所述变换图像通过对所述原始图像进行相似变化得到;
基于所述原始图像和所述变换图像,对预设的神经网络模型进行特征训练,以使得所述神经网络模型满足特征计算性能要求;
获取目标用户在客户端指定的分类图像以及所述分类图像的分类名称;
通过所述神经网络模型计算待分类图像与所述分类图像之间的特征距离是否满足预设的特征距离值,确定所述待分类图像是否与所述分类图像具有相同的类别及分类名称。
根据本公开实施例的一种具体实现方式,所述获取多个内容各不相同的原始图像以及与所述原始图像对应的变换图像,包括:
分别在多个预先设置的分类中填充多个原始图像,使得不同分类中原始图像的数目满足均衡性要求;
将满足均衡性要求的多个分类中的原始图像的集合作为图像集合;
对获取到的所述图像集合中的原始图像进行相似度判断;
基于所述判断的结果,将相似度小于预设相似度值的原始图片从所述图像集合中删除。
根据本公开实施例的一种具体实现方式,所述获取多个内容各不相同的原始图像以及与所述原始图像对应的变换图像,包括:
对所述原始图像执行色彩变化、图像裁剪、图像旋转及颜色通道提取中的至少一种变换操作;
将执行完变换操作之后的原始图像作为所述原始图像对应的变换图像。
根据本公开实施例的一种具体实现方式,所述基于所述原始图像和所述变换图像,对预设的神经网络模型进行特征训练,以使得所述神经网络模型满足特征计算性能要求,包括:
将原始图像和与所述原始图像对应的变换图像作为正样本、将不同内容的原始图像作为负样本,对预设的神经网络模型进行特征训练,以使得正样本之间的特征距离小于第一特征距离,负样本之间的特征距离大于第二特征距离,所述第一特征距离小于所述第二特征距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010523205.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序