[发明专利]时域动作检测方法和系统、电子设备、计算机存储介质有效
申请号: | 201710263004.2 | 申请日: | 2017-04-20 |
公开(公告)号: | CN108229280B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 汤晓鸥;熊元骏;赵岳;王利民;武智融;林达华 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08;G06T7/269 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时域 动作 检测 方法 系统 电子设备 计算机 存储 介质 | ||
1.一种时域动作检测方法,其特征在于,包括:
获取视频中存在动作实例的时域区间以及所述时域区间的至少一相邻片段;
分别提取候选片段中各视频片段的动作特征,其中,所述候选片段包括所述时域区间对应的视频片段及其相邻片段;
对所述候选片段中各视频片段的动作特征进行池化处理,获得所述时域区间对应的视频片段的全局特征;
基于所述全局特征确定所述时域区间对应的视频片段的动作完整度得分。
2.根据权利要求1所述的方法,其特征在于,所述至少一相邻片段包括:所述视频中时序位于所述时域区间之前的第一相邻片段,和/或,所述视频中时序位于所述时域区间之后的第二相邻片段;所述第一相邻片段和所述第二相邻片段分别包括至少一个视频片段。
3.根据权利要求1所述的方法,其特征在于,所述获取视频中存在动作实例的时域区间以及所述时域区间的至少一相邻片段,包括:
分别对所述视频中的各视频片段进行动作度估计,获得时序动作度序列;
基于所述时序动作度序列进行动作位置预测,获得所述视频中存在动作实例的时域区间,所述时域区间包括起始时间和结束时间;
从所述视频中提取所述时域区间之前的第一相邻片段和/或所述时域区间之后的第二相邻片段。
4.根据权利要求3所述的方法,其特征在于,所述分别对所述视频中的各视频片段进行动作度估计,获得时序动作度序列,包括:
分别针对所述视频中的任一视频片段:
提取一帧图像作为原始图像,对所述原始图像进行动作度估计,得到第一动作度值;提取所述任一视频片段的光流,并对获得的光流场图片进行合并,得到拼合光流场图像,对所述拼合光流场图像进行动作度估计,得到第二动作度值;
由第一动作度值与第二动作度值,获取所述任一视频片段的动作度值;
所述视频中所有视频片段基于时序关系的动作度值形成所述时序动作度序列。
5.根据权利要求4所述的方法,其特征在于,所述获取所述任一视频片段的动作度值之后,还包括:
对所述任一视频片段的动作度值进行归一化处理,得到归一化的动作度值;
所述时序动作度序列具体为:由归一化的动作度值形成的时序动作度序列。
6.根据权利要求1至5任意一项所述的方法,其特征在于,还包括:
基于所述时域区间对应的视频片段的动作特征,获取所述时域区间对应的视频片段的至少一个动作类别的分类得分;
根据所述时域区间对应的视频片段的至少一个动作类别的分类得分,确定所述时域区间对应的视频片段的检测动作类别。
7.根据权利要求6所述的方法,其特征在于,还包括:
输出所述时域区间以及所述时域区间对应的视频片段的检测动作类别。
8.根据权利要求6所述的方法,其特征在于,所述基于所述时域区间对应的视频片段的动作特征,获取所述时域区间对应的视频片段的至少一个动作类别的分类得分,包括:
分别基于所述时域区间对应的各视频片段的动作特征,获取所述时域区间对应的各视频片段分别属于所述至少一个动作类别的得分;
分别对所述时域区间对应的各视频片段属于同一动作类别的得分求和,获得所述时域区间对应的视频片段的至少一个动作类别的分类得分。
9.根据权利要求2所述的方法,其特征在于,所述对所述候选片段中各视频片段的动作特征进行池化处理,包括:
对提取的候选片段中各视频片段的动作特征进行时域金字塔式池化处理。
10.根据权利要求9所述的方法,其特征在于,所述对提取的候选片段中各视频片段的动作特征进行时域金字塔式池化处理之后,还包括:
合并时域金字塔式池化后得到的池化特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710263004.2/1.html,转载请声明来源钻瓜专利网。