[发明专利]精细化图像识别在审
申请号: | 201710592777.5 | 申请日: | 2017-07-19 |
公开(公告)号: | CN109284749A | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 傅建龙;梅涛 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;罗利娜 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关注区域 局部特征 子网络 全局特征 图像识别 精细化 图像 尺度 精细 对象识别 提取图像 图像区域 准确定位 网络 辨识 学习 | ||
1.一种设备(100),包括:
处理单元(110);以及
存储器(120),耦合至所述处理单元(110)并且包含存储于其上的指令,所述指令在由所述处理单元(110)执行时使所述设备(100)执行动作,所述动作包括:
利用第一学习网络(210)的第一子网络(212)提取图像(170)的全局特征(213);
利用所述第一学习网络(210)的第二子网络(214)、基于所述全局特征(213)确定所述图像(170)的第一关注区域(201),所述第一关注区域(201)包括所述图像(170)中对象的可辨识部分;
利用第二学习网络(220)的第一子网络(222)提取所述第一关注区域(201)的第一局部特征(223);以及
至少部分基于所述第一局部特征(223)确定所述图像(170)中的所述对象的类别。
2.根据权利要求1所述的设备(100),其中至少部分基于所述第一局部特征(223)确定所述图像(170)中的所述对象的类别包括:
利用所述第二学习网络(220)的第二子网络(324)、基于所述第一局部特征(223)确定所述图像(170)的第二关注区域(303),所述第二关注区域(303)被包括在所述第一关注区域(201)中并且包括所述图像(170)中所述对象的可辨识子部分;
利用第三学习网络(330)提取所述第二关注区域(303)的第二局部特征(333);以及
至少部分基于所述第二局部特征(333)确定所述图像(170)中的所述对象的所述类别。
3.根据权利要求2所述的设备(100),其中至少部分基于所述第二局部特征(333)确定所述图像(170)中的所述对象的所述类别还包括:
进一步基于所述全局特征(213)和所述第一局部特征(223)中的至少一个来确定所述图像(170)中的所述对象的所述类别。
4.根据权利要求1所述的设备(100),其中利用第二学习网络(220)的第一子网络(222)提取所述第一关注区域(201)的第一局部特征(223)包括:
放大所述第一关注区域(201);以及
利用所述第二学习网络(220)的所述第一子网络提取经放大的所述第一关注区域(201)的所述第一局部特征(223)。
5.根据权利要求1所述的设备(100),其中基于所述全局特征(213)确定所述图像(170)的所述第一关注区域(201)包括:
利用所述第一学习网络(210)的所述第二子网络(214)、基于所述全局特征(213)确定指示所述第一关注区域(201)在所述图像(170)中的位置的位置参数(215);以及
基于所述位置参数(215)从所述图像(170)确定所述第一关注区域(201)。
6.根据权利要求1所述的设备(100),其中至少部分基于所述第一局部特征(223)确定所述图像(170)中的所述对象的类别包括:
至少部分基于所述第一局部特征(223),从多个预定类别中确定所述图像(170)中的所述对象的所述类别,所述多个预定类别包括所述对象所属的一般类别中的多个细化类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710592777.5/1.html,转载请声明来源钻瓜专利网。