[发明专利]细粒度图像识别方法、装置、计算机设备及存储介质在审
申请号: | 201910751900.2 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110647912A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 罗茜;张斯尧;谢喜林;王思远;黄晋;文戎;张诚 | 申请(专利权)人: | 深圳久凌软件技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 43229 长沙德恒三权知识产权代理事务所(普通合伙) | 代理人: | 徐仰贵 |
地址: | 518000 广东省深圳市福田区梅林街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 细粒度 图像识别 双线性 分类识别 计算机设备 存储介质 获取图像 区域检测 人力成本 特征提取 图像分类 图像样本 并联 准确率 构建 标注 排序 样本 图像 分类 | ||
1.一种细粒度图像识别方法,其特征在于,包括如下步骤:
获取图像样本,并对图像分类属性进行标注;
构建双线性卷积神经网络模型;
将所述图像样本导入所述双线性卷积神经网络模型中训练,并获得细粒度图像识别模型,其中,所述双线性卷积神经网络模型包括依次连接的:2个并联的卷积神经网络CNN A和卷积神经网络CNN B、双线性池化层Bilinear pooling、归一化层LN和全连接层Fc;
从排序和所属类别两个方面对所述细粒度图像识别模型进行约束;
通过所述细粒度图像识别模型对通过图像采集模块获取的待识别图像进行分类识别。
2.如权利要求1所述的细粒度图像识别方法,其特征在于,所述获取图像样本,并对图像分类属性进行标注与所述构建双线性卷积神经网络模型,之间还包括:
对所述图像样本做预处理,其中,所述预处理包括直方图均衡化、图像二值化。
3.如权利要求1所述的细粒度图像识别方法,其特征在于,所述将所述图像样本导入基于双线性卷积神经网络细粒度图像识别模型中训练,并获得细粒度图像识别模型,还包括:
将所述图像样本分别导入所述卷积神经网络CNN A和所述卷积神经网络CNN B,其中,所述卷积神经网络CNN A包括多个依次连接的卷池组;所述卷积神经网络CNN B也包括多个依次连接的所述卷池组;所述卷池组包括依次连接的卷积层Conv和池化层Pool;
通过所述卷积层Conv对所述图像样本进行卷积操作,并通过激活函数计算卷积的输出;
通过所述池化层Pool对完成卷积操作的图像进行下采样操作以减少图像尺寸大小;
所述卷积神经网络CNN A输出特征向量X1,所述卷积神经网络CNN B输出特征向量X2;
将所述特征向量X1和所述特征向量X2均输入所述双线性池化层Bilinear pooling;
所述双线性池化层Bilinear pooling采用外积形式将所述特征向量X1和所述特征向量X2进行融合,并得到融合后的特征向量X1TX2;
将所述特征向量X1TX2输入所述归一化层LN,所述归一化层LN对所述特征向量X1TX2进行快速收敛;
将收敛后的所述特征向量X1TX2输入全连接层Fc,所述全连接层Fc对收敛后的所述特征向量X1TX2进行分类。
4.如权利要求3所述的细粒度图像识别方法,其特征在于,若所述卷积神经网络CNN A和所述卷积神经网络CNN B为相同的卷积神经网络,则所述特征向量X1=所述特征向量X2;取X=X1=X2,则所述特征向量X1TX2为XTX;所述全连接层Fc对收敛后的所述特征向量X1TX2进行分类,还包括:
所述全连接层Fc计算所述特征向量X1TX2所属各类别的分数;
其中,计算所属各类别的分数的公式为:
sk=(vecWk)T(vecXXT)+bk
其中,Sk为所属各类别的分数,k=1,2,...,K,K是所有的类别数,WK表示第k类的参数矩阵,bk是偏置值;XXT∈RD*D。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳久凌软件技术有限公司,未经深圳久凌软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910751900.2/1.html,转载请声明来源钻瓜专利网。