[发明专利]类别识别方法及装置、存储介质与终端在审
申请号: | 201910594260.9 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110298405A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 郭冠军 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 上海光栅知识产权代理有限公司 31340 | 代理人: | 马雯雯 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 初始图像 类别识别 存储介质 区域图像 细节特征 终端 准确度 融合 细分类 | ||
本公开提供一种类别识别方法及装置、存储介质与终端。该方法包括:对初始图像进行区域划分,得到至少一个区域图像,然后,提取各区域图像的细节特征,从而,根据各所述细节特征,获取所述初始图像的融合特征,进而,根据所述融合特征,识别所述初始图像所属的类别。本公开的方法能够提高类别识别结果的准确度与精确度,并满足大类别下的细分类识别需求。
技术领域
本公开涉及计算机技术,尤其涉及一种类别识别方法及装置、存储介质与终端。
背景技术
随着互联网技术的发展,针对图像的分析及处理方式也越来越多样化。例如,现有的特效技术中就经常涉及根据图像所属的场景类别,来对图像进行特效处理的技术。
针对图像所属类别的识别一般是通过神经网络模型实现的,也就是,直接将待识别图像输入神经网络模型,得到神经网络模型输出的类别识别结果,即可得到待识别图像所属的类别。现有技术中,神经网络模型主要是基于图像中的明显特征来实现类别识别的,因此,现有的类别识别方法主要应用于对具有明显区别的大类进行识别。例如,通过神经网络模型处理图像,以确定图像所属场景是食物场景,还是室内场景,还是人物场景。
但是,现有的神经网络模型仅以明显特征来实现类别识别,这种识别方式存在较多的细节损失,因而,无法实现对于某一大类下的子类识别,换言之,现有的类别识别方法的识别精度较低。
发明内容
本公开提供一种类别识别方法及装置、存储介质与终端,用以提高类别识别结果的准确度与精确度。
第一方面,本公开提供一种类别识别方法,包括:
对初始图像进行区域划分,得到至少一个区域图像;
提取各区域图像的细节特征;
根据各所述细节特征,获取所述初始图像的融合特征;
根据所述融合特征,识别所述初始图像所属的类别。
第二方面,本公开提供一种类别识别装置,包括:
分割模块,用于对初始图像进行区域划分,得到至少一个区域图像;
提取模块,用于提取各区域图像的细节特征;
融合模块,用于根据各所述细节特征,获取所述初始图像的融合特征;
识别模块,用于根据所述融合特征,识别所述初始图像所属的类别。
第三方面,本公开提供一种类别识别装置,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。
第四方面,本公开提供一种终端,包括:
类别识别装置,用于实现如第一方面所述的方法;
终端主体。
第五方面,本公开提供一种计算机可读存储介质,其上存储有计算机程序,
所述计算机程序被处理器执行以实现如第一方面所述的方法。
本公开提供的一种类别识别方法及装置、存储介质与终端,通过对初始图像进行区域划分,然后,针对各个区域图像分别进行特征提取,并基于提取出的各细节特征实现类别识别。如此,将各区域的细节特征作为一个类别识别维度,降低了图像的细节损失,使得类别识别结果更加准确与精确;而且,细节特征参与类别识别过程,不仅能实现大类识别,也能够实现大类下的细分类识别,在一定程度上拓宽了类别识别的应用范围及场景。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910594260.9/2.html,转载请声明来源钻瓜专利网。