[发明专利]用于增强图像分类的负采样算法在审
申请号: | 202080058773.9 | 申请日: | 2020-06-17 |
公开(公告)号: | CN114287005A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | O·尼尔;M·宗塔克;T·C·伯恩斯;A·辛格哈尔;张磊;I·奥弗;A·勒维;H·萨博;I·巴尔-梅纳凯姆;E·亚米;E·本托夫;A·扎曼 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V20/40;G06V10/25;G06V10/764;G06V10/774 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 增强 图像 分类 采样 算法 | ||
1.一种用于索引视频的方法,包括:
标识所述视频的帧中围绕目标内容的一个或多个感兴趣区域;
在所述帧的在感兴趣区域外部的部分中,标识与所述感兴趣区域相邻的潜在空区域;
标识所述潜在空区域中的满足一个或多个标准的至少一个空区域;以及
将所述至少一个空区域分类为所述目标内容的负样本。
2.根据权利要求1所述的方法,还包括:
将所述目标内容的所述负样本包括在所述目标内容的负样本集中;以及
基于包括所述负样本集的训练数据来训练机器学习模型,以标识所述目标内容的实例。
3.根据权利要求1所述的方法,其中:
所述目标内容包括所述视频中的动画角色;
所述感兴趣区域包括围绕所述动画角色的边界框;以及
与所述感兴趣区域相邻的所述潜在空区域包括矩形,每个矩形的一侧与所述边界框相邻。
4.根据权利要求3所述的方法,其中:
所述矩形包括如下的空矩形,所述空矩形不与围绕所述目标内容的所述一个或多个感兴趣区域中的任何一个感兴趣区域重叠;以及
标识满足所述一个或多个标准的所述至少一个空区域包括:标识所述空矩形中的最大空矩形。
5.根据权利要求3所述的方法,其中针对所述矩形中的每个矩形,所述一个或多个标准包括:
给定的矩形是否因不包括围绕所述目标内容的所述一个或多个感兴趣区域中的任何一个感兴趣区域而被算作空;以及
所述给定的矩形的尺寸是否满足尺寸阈值。
6.根据权利要求5所述的方法,还包括:针对被算作空但不满足尺寸阈值的矩形,将该矩形丢弃,而不将该矩形分类为所述目标内容的任何类型的样本。
7.根据权利要求5所述的方法,还包括:针对不被算作空的矩形:
标识与该矩形的如下矩形部分相邻的潜在空矩形,所述矩形部分包括围绕另一个动画角色的另一个边界框的至少一部分;
标识所述潜在空矩形中的被算作空且满足所述尺寸阈值的至少一个空矩形;以及
将所述至少一个空矩形分类为所述目标内容的负样本。
8.根据权利要求1所述的方法,其中:
所述目标内容包括所述视频中的动画角色;
所述一个或多个感兴趣区域包括围绕所述帧中的所述动画角色的实例绘制的边界框;
所述帧的在所述感兴趣区域外部的部分包括由所述感兴趣区域的边界和所述帧的边界限定的边界区域;以及
所述感兴趣区域包括所述边界框中的最中心的边界框。
9.一种计算装置,包括:
一个或多个计算机可读存储介质;
一个或多个处理器,所述一个或多个处理器可操作地与所述一个或多个计算机可读存储介质耦合;以及
程序指令,所述程序指令存储在所述一个或多个计算机可读存储介质上并用于索引视频,当由所述一个或多个处理器执行时,所述程序指令指示所述计算装置至少:
标识所述视频的帧中的围绕目标内容的一个或多个感兴趣区域;
在所述帧的在感兴趣区域外部的部分中,标识与所述感兴趣区域相邻的潜在空区域;
标识所述潜在空区域中的满足一个或多个标准的至少一个空区域;以及
将所述至少一个空区域分类为所述目标内容的负样本。
10.根据权利要求9所述的计算装置,其中所述程序指令还指示所述计算装置:
将所述目标内容的所述负样本包括在所述目标内容的负样本集中;以及
基于包括所述负样本集的训练数据来训练机器学习模型,以标识所述目标内容的实例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080058773.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序