[发明专利]基于深度特征区域融合的丝绸文物图像检索方法有效
申请号: | 202010498104.5 | 申请日: | 2020-06-04 |
公开(公告)号: | CN111737512B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 赵鸣博;沙晟涛 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/62;G06F16/55;G06F16/54 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐俊 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 特征 区域 融合 丝绸 文物 图像 检索 方法 | ||
1.一种基于深度特征区域融合的丝绸文物图像检索方法,其特征在于,包括以下步骤:
步骤1、采用深度学习全局特征提取方式对丝绸文物图像进行分类学习,将所有丝绸文物图像分为不同的类别;
步骤2、采用神经网络可视化的方式对步骤1确定的每一类别的丝绸文物图像对应的激活区域进行选择,进而实现目标定位,包括以下步骤:
步骤201、利用Grad-CAM方法对步骤1确定的每一类别的丝绸文物图像的特征面进行融合获得Grad-CAM图;
步骤202、对每一类别的Grad-CAM图进行全局平均值池化,即取Grad-CAM图平均值并打分,高于某一个阈值的Grad-CAM图保留,表明该Grad-CAM图包含有的当前类别的目标;
步骤203、根据保留的Grad-CAM图的轮廓,定位所对应类别的目标的具体位置,实现目标定位;
步骤3、通过区域特征融合的方式,将涉及到目标区域的特征进行融合作为该目标的局部描述符,包括以下步骤:
步骤301、通过对检测目标进行定位,得到该目标在其定位区域的卷积结果为一个H×W×D的Tensor特征面,H、W、D分别表示特征面的高、宽和通道数量;
步骤302、采用Region Maximum Activation of Convolutions的策略,将H×W×D的Tensor特征面看作一个数量为D的H×W维的描述子,通过对D个H×W的描述子进行局部的平均值池化或最大化池化,即得到一个D维特征来代表该目标;
步骤4、获得用户请求图片,采用步骤2及步骤3所述的方法获得用户请求图片的特征,在局部特征空间中,计算用户请求图片的特征与每一类丝绸文物图像的特征之间的欧式距离,选择与用户请求图片的特征距离最近的那一类丝绸文物图像进行检索。
2.如权利要求1所述的一种基于深度特征区域融合的丝绸文物图像检索方法,其特征在于,步骤1中,在进行所述分类学习时,利用迁移学习的方式对目标数据在预训练模型上进行分类微调。
3.如权利要求1所述的一种基于深度特征区域融合的丝绸文物图像检索方法,其特征在于,步骤302中,如果一幅图片包含多个目标,采用区域特征融合的方式将不同目标的D维特征串联起来作为输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010498104.5/1.html,转载请声明来源钻瓜专利网。