[发明专利]一种面向数字人文的移动视觉检索方法有效
申请号: | 201810474540.1 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108733801B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 曾子明;秦思琪 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种面向数字人文的移动视觉检索方法,包括:首先构建基于深度哈希的图像语义提取模型;通过预训练对模型各处理层的参数进行初始化;构造适用于数字人文领域的损失函数;采集数字人文图像样本,并构建模型训练数据集和验证集;对图像样本进行预处理;使用构建的损失函数和数字人文训练集对模型进行训练,优化模型参数;使用完成训练的模型提取图像语义特征向量,完成图像检索流程。本发明针对数字人文移动视觉检索中的图像深度语义特征提取和数据传输规模限制两大挑战,结合深度学习和哈希方法提出基于深度哈希的数字人文移动视觉搜索方法,该方法在数字人文领域数据集上表现优异。 | ||
搜索关键词: | 一种 面向 数字 人文 移动 视觉 检索 方法 | ||
【主权项】:
1.一种面向数字人文的移动视觉检索方法,其特征在于,包含以下步骤:步骤1,构建基于深度哈希的图像语义提取模型,该模型总共分为九个处理层:包括五个卷积层、两个全连接层、一个哈希层和一个输出层;步骤2,对模型进行预训练,使用预训练模型参数作为各处理层的初始化参数;步骤3,构造基于深度哈希的图像语义提取模型的损失函数;步骤4,采集图像样本,构建模型训练集和验证集;步骤5,图像预处理,减少图像光照、大小对模型的影响;步骤6,使用步骤3中构建的损失函数和步骤4构建的训练集对模型进行训练,优化模型参数;步骤7,利用步骤6中训练完成的模型提取图像语义特征,使用步骤4中的验证集作为图像检索集,训练集作为目标集,计算图像间的距离,并根据距离大小进行排序,返回图像检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810474540.1/,转载请声明来源钻瓜专利网。