[发明专利]一种家居图像多目标识别方法及装置有效
申请号: | 201910428783.6 | 申请日: | 2019-05-22 |
公开(公告)号: | CN110210538B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 周成成;杨兵强;周贤德;吴轲 | 申请(专利权)人: | 雷恩友力数据科技南京有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 210042 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 家居 图像 多目标 识别 方法 装置 | ||
1.一种家居图像多目标识别方法,其特征在于,包括:
获取家居图像数据集作为训练集;
将在目标领域图像数据集上训练好的卷积神经网络模型作为预训练模型,采用迁移学习的方法,保留预训练模型的卷积层和池化层,并将预训练模型中卷积层和池化层学习到的特征权重作为训练集训练的初始特征权重,通过保留的卷积层和池化层提取训练集的图像特征,构建第一特征图和池化特征图;其中,所述第一特征图是由保留的预训练模型的最后一层卷积层输出,所述池化特征图是由保留的预训练模型的最后一层池化层输出;
对池化特征图进行三次卷积操作,得到第二特征图,包括:
将卷积神经网络模型的全连接层替换成三层全卷积层;
利用得到的三层全卷积层,对池化特征图进行三次卷积操作,得到第二特征图;
对第一特征图和第二特征图依次作全局均值池化、归一化、反池化、反卷积操作,将反卷积操作后的两组特征图进行融合;
其中,全局均值池化操作包括:将第一特征图的所有像素值相加再除以第一特征图的大小,得到第一特征图的像素平均值;还将第二特征图的所有像素值相加再除以第二特征图的大小,得到第二特征图的像素平均值;
归一化步骤包括:进行归一化操作将不同特征图的分布统一到一个预设的区间内,使用L2归一化函数进行归一化操作,其中,L2归一化函数表示为:
其中,输入d维特征图向量x=[x1,x2,…,xd],对x进行归一化得到上标T表示转置;
反池化步骤包括:将归一化输出的特征图恢复到全局均值池化前的尺寸,将全局均值池化层得到的平均值填入特征图的每个位置;
反卷积操作包括:将反池化层输出的图像恢复到输入特征迁移模块时的尺寸,即原图尺寸,具体的:对特征迁移步骤输出的经全局均值池化、归一化、反池化处理得到的特征图进行16倍上采样,对全卷积步骤输出的经全局均值池化、归一化、反池化处理得到的特征图进行32倍上采样;
融合步骤包括:将反卷积处理后得到的两组特征图,按位相加得到最后的融合结果;
利用softmax分类器对融合后的特征图进行分类识别。
2.根据权利要求1所述的家居图像多目标识别方法,其特征在于,所述利用softmax分类器对融合后的特征图进行分类识别包括:
使用softmax分类器对融合特征图的每一个像素点计算分类损失,将每个像素点在所有第二特征图中该像素位置的概率最高的类别作为该像素点的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雷恩友力数据科技南京有限公司,未经雷恩友力数据科技南京有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910428783.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序