[发明专利]利用深度网络对个人照片加标签在审
申请号: | 201580056088.1 | 申请日: | 2015-10-07 |
公开(公告)号: | CN107077487A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | 梅涛;傅建龙;杨奎元;芮勇 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 深度 网络 个人 照片 标签 | ||
1.一种方法,包括:
提供针对个人数字图像的本体,所述本体包括层次结构,所述层次结构包含多个概念,所述多个概念被分组成所述层次结构的多个节点,所述多个概念中的每个概念包括用于与一个或多个个人数字图像相关联的文本描述符;
提供来自源域的多个源数字图像,所述源数字图像中的每个源数字图像具有至少一个关联的文本描述符;
提供来自目标域的多个目标数字图像;
在计算设备上使用所述源数字图像、所述目标数字图像以及所述本体来训练深度网络;
在所述计算设备处接收一个或多个个人数字图像;
使用所述计算设备将所述深度网络应用到所述一个或多个个人数字图像,以确定所述概念中的、用于与所述一个或多个个人数字图像中的每个个人数字图像相关联的一个或多个概念;以及
将所述概念中的所述一个或多个概念中的至少一个概念与所述一个或多个个人数字图像中的每个个人数字图像相关联。
2.根据权利要求1所述的方法,其中训练所述深度网络包括:在所述源数字图像和所述目标数字图像上训练多个卷积自动编码器,以确定深度特征抽象。
3.根据权利要求1或2所述的方法,还包括使用所述本体来对所述深度特征抽象进行精细调谐以获得经精细调谐的深度特征抽象,并且其中应用所述深度网络包括:将所述经精细调谐的深度特征抽象应用到所述个人数字图像中的所述一个或多个个人数字图像。
4.根据权利要求1-3中的任一项所述的方法,还包括通过以下来创建针对个人数字图像的所述本体:
识别所述多个概念;
将所述多个概念分组成多个种类,所述多个种类中的每个种类包括所述多个概念中的一个或多个概念;以及
将每个概念与概念文本表达相关联,以识别在源域中存储的图像中的概念,所述概念文本表达与在所述源域中使用的源文本表达匹配。
5.根据权利要求1-4中的任一项所述的方法,其中将所述深度网络应用到所述个人数字图像中的一个或多个个人数字图像包括:考虑所述个人数字图像中的所述一个或多个个人数字图像的属性,以分配所述一个或多个概念。
6.一种设备,包括:
一个或多个计算机可读介质,其上具有多个模块、源图像储存库、目标图像储存库以及本体储存库;
处理单元,其可操作地耦合到所述计算机可读介质,所述处理单元适于执行包括以下的所述多个模块中的模块:
卷积自动编码器训练模块,其用于使用来自所述源图像储存库的源图像和来自所述目标图像储存库的目标图像,来训练包括深度网络的一个或多个卷积自动编码器;
顶级训练模块,其用于使用来自所述本体储存库的本体来训练所述深度网络的顶级;
评分模块,其用于针对多个图像中的个体图像,使用所述深度网络和与所述多个图像相关联的元数据,来确定针对所述本体中的多个概念中的每个概念的置信评分;以及
加标签模块,其用于至少部分地基于所述置信评分来选择所述多个概念中的一个或多个概念,以用于对所述多个图像中的每个图像加标签。
7.根据权利要求6所述的设备,其中训练所述一个或多个卷积自动编码器包括:从所述源图像和所述目标图像的原像素中发现共享的深度特征抽象。
8.根据权利要求6或7所述的设备,还包括精细调谐模块,所述精细调谐模块用于使用所述源图像以监督式方式对所述共享的深度特征抽象进行精细调谐。
9.根据权利要求6-8中的任一项所述的设备,其中所述卷积自动编码器包括多个卷积自动编码器的堆叠。
10.根据权利要求6-9中的任一项所述的设备,其中所述顶级是完全连接的顶层。
11.根据权利要求6-10中的任一项所述的设备,其中所述加标签模块选择与高于阈值评分的置信评分相对应的概念、或与预定数量的最高置信评分相对应的概念,以用于对所述多个图像中的每个图像加标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580056088.1/1.html,转载请声明来源钻瓜专利网。