首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]细粒度图像识别方法、装置、计算机设备及存储介质在审

申请号：	201910751900.2	申请日：	2019-08-15
公开（公告）号：	CN110647912A	公开（公告）日：	2020-01-03
发明（设计）人：	罗茜;张斯尧;谢喜林;王思远;黄晋;文戎;张诚	申请（专利权）人：	深圳久凌软件技术有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08
代理公司：	43229 长沙德恒三权知识产权代理事务所(普通合伙)	代理人：	徐仰贵
地址：	518000 广东省深圳市福田区梅林街道***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	卷积神经网络细粒度图像识别双线性分类识别计算机设备存储介质获取图像区域检测人力成本特征提取图像分类图像样本并联准确率构建标注排序样本图像分类
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种细粒度图像识别方法，其特征在于，包括如下步骤：

获取图像样本，并对图像分类属性进行标注；

构建双线性卷积神经网络模型；

将所述图像样本导入所述双线性卷积神经网络模型中训练，并获得细粒度图像识别模型，其中，所述双线性卷积神经网络模型包括依次连接的：2个并联的卷积神经网络CNN A和卷积神经网络CNN B、双线性池化层Bilinear pooling、归一化层LN和全连接层Fc；

从排序和所属类别两个方面对所述细粒度图像识别模型进行约束；

通过所述细粒度图像识别模型对通过图像采集模块获取的待识别图像进行分类识别。

2.如权利要求1所述的细粒度图像识别方法，其特征在于，所述获取图像样本，并对图像分类属性进行标注与所述构建双线性卷积神经网络模型，之间还包括：

对所述图像样本做预处理，其中，所述预处理包括直方图均衡化、图像二值化。

3.如权利要求1所述的细粒度图像识别方法，其特征在于，所述将所述图像样本导入基于双线性卷积神经网络细粒度图像识别模型中训练，并获得细粒度图像识别模型，还包括：

将所述图像样本分别导入所述卷积神经网络CNN A和所述卷积神经网络CNN B，其中，所述卷积神经网络CNN A包括多个依次连接的卷池组；所述卷积神经网络CNN B也包括多个依次连接的所述卷池组；所述卷池组包括依次连接的卷积层Conv和池化层Pool；

通过所述卷积层Conv对所述图像样本进行卷积操作，并通过激活函数计算卷积的输出；

通过所述池化层Pool对完成卷积操作的图像进行下采样操作以减少图像尺寸大小；

所述卷积神经网络CNN A输出特征向量X₁，所述卷积神经网络CNN B输出特征向量X₂；

将所述特征向量X₁和所述特征向量X₂均输入所述双线性池化层Bilinear pooling；

所述双线性池化层Bilinear pooling采用外积形式将所述特征向量X₁和所述特征向量X₂进行融合，并得到融合后的特征向量X₁^TX₂；

将所述特征向量X₁^TX₂输入所述归一化层LN，所述归一化层LN对所述特征向量X₁^TX₂进行快速收敛；

将收敛后的所述特征向量X₁^TX₂输入全连接层Fc，所述全连接层Fc对收敛后的所述特征向量X₁^TX₂进行分类。

4.如权利要求3所述的细粒度图像识别方法，其特征在于，若所述卷积神经网络CNN A和所述卷积神经网络CNN B为相同的卷积神经网络，则所述特征向量X₁＝所述特征向量X₂；取X＝X₁＝X₂，则所述特征向量X₁^TX₂为X^TX；所述全连接层Fc对收敛后的所述特征向量X₁^TX₂进行分类，还包括：

所述全连接层Fc计算所述特征向量X₁^TX₂所属各类别的分数；

其中，计算所属各类别的分数的公式为：

s_k＝(vecW_k)^T(vecXX^T)+b_k

其中，S_k为所属各类别的分数，k＝1，2，...，K，K是所有的类别数，W_K表示第k类的参数矩阵，b_k是偏置值；XX^T∈R^D*D。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳久凌软件技术有限公司，未经深圳久凌软件技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910751900.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于主成分分析和深度信念网络的轴承故障诊断方法
下一篇：基于聚类算法的异常数据检测方法及装置

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top