[发明专利]视频时序动作的检测方法、装置、电子设备及存储介质有效
申请号: | 202010026653.2 | 申请日: | 2020-01-10 |
公开(公告)号: | CN111222476B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 林天威;李鑫;何栋梁;李甫;孙昊;文石磊;丁二锐 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V40/20;G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 时序 动作 检测 方法 装置 电子设备 存储 介质 | ||
1.一种视频时序动作的检测方法,其特征在于,包括:
获取待检测视频的初始时序特征序列;
采用预先训练的视频时序动作检测模块,基于所述初始时序特征序列获取配置的多个时序锚定框的隐式特征和显式特征;
采用所述视频时序动作检测模块,根据所述多个时序锚定框的显式特征和隐式特征,从所述多个时序锚定框中获取包含指定动作的视频片段的起始位置、结束位置、所述指定动作的类别以及所述指定动作属于所述类别的概率;
采用预先训练的视频时序动作检测模块,基于所述初始时序特征序列获取配置的多个时序锚定框的隐式特征,包括:
由所述视频时序动作检测模块,按照预设的多种减小时序长度的方式,减小所述初始时序特征序列的时序长度,得到多种调整后的参考时序特征序列;
对于各所述参考时序特征序列,为各时序位置配置预设数量的、不同尺度的时序锚定框,得到所述多个时序锚定框;且同一所述时序位置的所述预设数量的所述时序锚定框具有相同的中心;各所述时序锚定框对应一个时长范围内的特征信息;
将所述多个时序锚定框中各所述时序锚定框的隐式特征配置为对应的所述参考时序特征序列中对应的所述时序位置的特征。
2.根据权利要求1所述的方法,其特征在于,获取待检测视频的初始时序特征序列,包括:
从所述待检测的视频中按照从前至后的抽取顺序、采用预设的采样周期依次抽取多张图像,构成图像序列;
提取所述图像序列中的各张所述图像的特征,并按照在所述图像序列中的先后顺序拼接为所述初始时序特征序列。
3.根据权利要求1所述的方法,其特征在于,采用预先训练的视频时序动作检测模块,基于所述初始时序特征序列获取配置的多个时序锚定框的显式特征,包括:
以多种所述参考时序特征序列中长度最长的参考时序特征序列为采样样本,按照为各所述时序锚定框构造的采样特征,采用所述采样特征乘以所述采样样本的方式,获取各所述时序锚定框的显式特征。
4.根据权利要求1所述的方法,其特征在于,采用所述视频时序动作检测模块,根据所述多个时序锚定框的显式特征和隐式特征,从所述多个时序锚定框中获取包含指定动作的视频片段的起始位置、结束位置、所述指定动作的类别以及所述指定动作属于所述类别的概率,包括:
采用所述视频时序动作检测模块,将各所述时序锚定框的显式特征和隐式特征拼接,得到各所述时序锚定框的综合特征;
基于各所述时序锚定框的综合特征,对各所述时序锚定框进行检测,筛取包含有所述指定动作的目标时序锚定框、所述指定动作的类别以及所述指定动作属于所述类别的概率;
在所述初始时序特征序列中对包含所述指定动作的所述目标时序锚定框的边界进行检测,获取所述目标时序锚定框对应的视频片段的起始位置和结束位置。
5.根据权利要求4所述的方法,其特征在于,在所述初始时序特征序列中对包含所述指定动作的所述目标时序锚定框的边界进行检测之后,获取所述目标时序锚定框对应的视频片段的起始位置和结束位置之前,还包括:
结合所述初始时序特征序列中、检测到的所述目标时序锚定框的边界的前后多个时序特征,对所述目标时序锚定框对应的视频片段的起始位置和结束位置进行逻辑回归分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010026653.2/1.html,转载请声明来源钻瓜专利网。