[发明专利]用于训练表征模型的方法和装置在审
申请号: | 201911024846.8 | 申请日: | 2019-10-25 |
公开(公告)号: | CN112347278A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 于伟;王林芳;梅涛 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/583 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 表征 模型 方法 装置 | ||
1.一种用于训练表征模型的方法,包括:
基于样本图片集的类目信息构建起语义树;
初始化所述语义树每条边的权重;
基于权重执行以下训练步骤:基于各叶子节点之间最短路径距离设置待训练的表征模型的损失函数的截断系数;基于所述损失函数优化所述表征模型;基于优化后的表征模型计算各样本图片之间的距离,转化为各叶子节点之间最短路径距离的更新量,根据所述更新量对语义树上叶子节点连接的边权重进行更新;若满足预定条件,则输出所述表征模型;
否则,基于更新后的权重计算出各叶子节点之间最短路径距离后继续执行上述训练步骤。
2.根据权利要求1所述的方法,其中,所述基于样本图片集的类目信息构建起语义树,包括:
根据语义信息的从属关系,获得样本图片集的类目信息作为图片不同等级的标签;
根据多级标签构建起语义树,其中,根节点为物品,下一层节点为一级标签,依次向下,最底层的叶子节点为最深级标签。
3.根据权利要求1所述的方法,其中,所述损失函数如下式所示:
其中,i、j、k分别为样本图片的索引编号,fi、fj、fk分别表示第i、j、k个样本图片的特征。P和N分别为正例/负例的集合,D()计算两个样本图片的距离,Mi,k为两个样本图片最深级标签对应的截断系数。
4.根据权利要求3所述的方法,其中,所述截断系数采用以下形式进行更新:
其中,m为初始值、α为优化步长,Si,j为两个样本图片之间的距离。
5.根据权利要求1所述的方法,其中,所述预定条件包括:
叶子节点之间的最短路径距离排序不再变化。
6.一种用于输出信息的方法,包括:
将数据库中的图片输入根据权利要求1-5之一所述的方法训练好的表征模型得到特征集合;
将目标图片输入所述表征模型得到目标特征;
分别计算目标特征与特征集合中的特征的相似度;
按相似度由大到小的顺序输出预定数目的图片。
7.一种用于训练表征模型的装置,包括:
构建单元,被配置成基于样本图片集的类目信息构建起语义树;
初始化单元,被配置成初始化所述语义树每条边的权重;
训练单元,被配置成基于权重执行以下训练步骤:基于各叶子节点之间最短路径距离设置待训练的表征模型的损失函数的截断系数;基于所述损失函数优化所述表征模型;基于优化后的表征模型计算各样本图片之间的距离,转化为各叶子节点之间最短路径距离的更新量,根据所述更新量对语义树上叶子节点连接的边权重进行更新;若满足预定条件,则输出所述表征模型;
循环单元,被配置成若不满足预定条件,基于更新后的权重计算出各叶子节点之间最短路径距离后继续执行上述训练步骤。
8.一种用于输出信息的装置,包括:
建库单元,被配置成将数据库中的图片输入根据权利要求1-5之一所述的方法训练好的表征模型得到特征集合;
查询单元,被配置成将目标图片输入训练好的所述表征模型得到目标特征;
计算单元,被配置成分别计算目标特征与特征集合中的特征的相似度;
按相似度由大到小的顺序输出预定数目的图片。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911024846.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:烤箱及气悬浮装置
- 下一篇:用于输出信息的方法和装置