[发明专利]一种时序动作检测方法、装置及计算机设备在审
申请号: | 202010686641.2 | 申请日: | 2020-07-16 |
公开(公告)号: | CN111860289A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 刘川贺;汪明浩 | 申请(专利权)人: | 北京思图场景数据科技服务有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 王霞 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时序 动作 检测 方法 装置 计算机 设备 | ||
本发明涉及视频图像处理技术领域,具体涉及一种时序动作检测方法、装置及计算机设备。包括获取待测视频的基础时序特征序列;采用预置的导向锚点模块对基础时序特征序列进行锚点边界预测和时序特征预测,获得锚点边界和时序特征图;根据锚点边界和时序特征图确定时序动作检测结果。本发明可以有效去除非目标区域对时序动作检测的影响,节省时序动作检测的计算开销,提高时序动作检测效率。
技术领域
本发明涉及视频图像处理技术领域,具体涉及一种时序动作检测方法、装置及计算机设备。
背景技术
为了提高视频剪辑的效率,通常需要采用相应的技术手段去帮助视频作者或是视频平台自动地从长视频中剪辑出指定动作类别的短视频片段。自动剪辑过程中相关的算法任务为视频时序动作检测任务,其目的是在未裁剪的长视频中检测时序动作片段的开始时间、结束时间、置信度分数以及动作类别。时序动作检测是精彩视频智能剪辑的关键技术。
现有的时序动作检测过程一般都会采用滑动窗口或者边界概率图生成大量分散的动作候选边界区域,之后对候选区域进行分类以及回归来微调边界。这样的方式还存在着一些不足,比如:
1、要针对特定的问题来设置不同的滑动窗口,一旦设计不合理会使得检测速度和准确度都下降。
2、为了保持对候选区域的高召回率,需要生成大量的候选边界,包含锚点对象边界和非锚点对象边界,但其中一大部分候选边界区域都是背景(非锚点对象边界),与需要的目标(锚点对象)区域是无关的,且大量的候选边界区域会导致大量的计算开销。
因此,现有的视频时序动作检测方式的实现过程较为繁琐,造成时序动作检测效率偏低,丞待改进。
发明内容
针对现有技术存在的不足,本发明提供了一种时序动作检测方法、装置及计算机设备,其应用时,可以有效去除非目标区域对时序动作检测的影响,节省时序动作检测的计算开销,提高时序动作检测效率。
第一方面,本发明提供一种时序动作检测方法,包括:
获取待测视频的基础时序特征序列;
采用预置的导向锚点模块对基础时序特征序列进行锚点边界预测和时序特征预测,获得锚点边界和时序特征图;
根据锚点边界和时序特征图确定时序动作检测结果。
基于上述发明内容,可以从待测视频中提取出相应的基础时序特征序列,再通过导向锚点模块完成对基础时序特征序列的锚点边界预测和时序特征预测,获得锚点边界和时序特征图,从而来确定时序动作检测结果,其应用时,替代现有的时序动作检测方式,直接从基础时序特征序列中预测获得锚点边界和对应的时序特征图,而不需要生成大量的候选边界,再进行繁琐的分类及调整过程,去除了非目标区域对时序动作检测的影响,节省时序动作检测的计算开销,提高时序动作检测效率。
在一个可能的设计中,获取待测视频的基础时序特征序列,包括:
根据设定的采样周期从待测视频中按时间顺序抽取若干帧图像,组成图像序列;
提取图像序列中各帧图像的特征点,并按照时间顺序组合成基础时序特征序列。
在一个可能的设计中,所述导向锚点模块包括锚点位置预测子网络,对基础时序特征序列进行锚点边界预测,包括:
通过锚点位置预测子网络预测基础时序特征序列中每一个特征点存在目标锚点的概率;
将概率大于设定阈值的特征点标定为动作锚点,并获得动作锚点的时间点。
在一个可能的设计中,所述导向锚点模块包括锚点形状预测子网络,对基础时序特征序列进行锚点边界预测,包括:
通过锚点形状预测子网络预测动作锚点的动作时间宽度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思图场景数据科技服务有限公司,未经北京思图场景数据科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010686641.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型基站用光缆
- 下一篇:一种新型防鼠防蚁拉远光缆