[发明专利]运动物体检测方法及其相关设备有效
申请号: | 202310043284.1 | 申请日: | 2023-01-29 |
公开(公告)号: | CN116052047B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 田贤浩;王瑞星 | 申请(专利权)人: | 荣耀终端有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/82;G06T7/246 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李红艳 |
地址: | 518040 广东省深圳市福田区香蜜湖街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运动 物体 检测 方法 及其 相关 设备 | ||
本申请提供一种运动物体检测方法及其相关设备,涉及图像处理领域,该方法包括:获取视频码流数据,并提取压缩域语法元素,压缩域语法元素用于指示视频码流数据中的变量信息;根据压缩域语法元素,利用运动检测网络进行检测,确定目标运动物体。本申请通过结合压缩域语法元素,利用网络模型进行运动物体检测,从而可以实现保证实时性、适应复杂场景的目的。
技术领域
本申请涉及图像处理领域,具体涉及一种运动物体检测方法及其相关设备。
背景技术
运动物体检测是计算机视觉的一个研究热点,它可以为视频分析、视频检索等提供支持,在人机交互、医疗诊断等领域都有着越来越重要的应用前景。
现有提供的检测方法大部分是在像素域通过算法对视频像素数据进行计算,估计出视频中的运动对象,然而,随着视频分辨率越来越高,需要处理的视频像素数据越来越庞大,如此操作将要耗费大量的计算资源,计算速度也相应变慢。对此,亟需一种新的运动物体检测方法。
发明内容
本申请提供一种运动物体检测方法及其相关设备,通过结合压缩域语法元素,利用网络模型进行运动物体检测,从而可以实现保证实时性、适应复杂场景的目的。
第一方面,提供了一种运动物体检测方法,该方法包括:
获取视频码流数据,并提取压缩域语法元素,所述压缩域语法元素用于指示所述视频码流数据中的变量信息;
根据所述压缩域语法元素,利用运动检测网络进行检测,确定目标运动物体。
本申请实施例可以直接利用视频编码过程中产生的运动信息,节省了运动信息的计算步骤;另外,又结合了运动检测网络进行检测,从而可以实现高效、快速的视频运动目标检测任务,在保证实时性的基础下,解决相关方法中在复杂场景下的鲁棒性问题。
结合第一方面,在第一方面的某些实现方式中,根据所述压缩域语法元素,利用运动检测网络进行检测,确定目标运动物体,包括:
根据所述压缩域语法元素,确定运动特征;
根据所述运动特征,生成二维矩阵;
将所述二维矩阵输入所述运动检测网络进行检测,确定所述目标运动物体。
在本申请实施例中,本申请无需解码帧图像数据,可直接从压缩域中提取可靠的压缩域语法元素进行运动分析,因此处理速度容易达到实时性。又结合了运动检测网络进行检测,从而可以实现高效、快速的视频运动目标检测任务,在保证实时性的基础下,解决相关方法中在复杂场景下的鲁棒性弱、性能差的问题。
结合第一方面,在第一方面的某些实现方式中,根据所述压缩域语法元素,确定运动特征,包括:
根据P帧的压缩域语法元素,确定P帧对应的运动特征,所述视频码流数据包括I帧、P帧和B帧;
根据B帧的压缩域语法元素,确定B帧对应的运动特征;
根据所述I帧前后相邻的P帧对应的运动特征和/或B帧对应的运动特征,利用插值方法,确定所述I帧对应的运动特征。
在本申请实施例中,结合P帧和B帧的运动信息,基于运动物体的时空连贯性,对运动特征进行插值处理,从而可以得到I帧的运动信息,这样就可以确定出每帧对应的运动信息。
结合第一方面,在第一方面的某些实现方式中,所述方法还包括:
对所述I帧、所述P帧和所述B帧对应的运动特征,进行平滑处理。
在本申请实施例中,进行平滑处理后,相邻视频帧之间的运动信息过渡更加自然,可以去除误检区域的噪声,还可以避免出现个别数据异常、差异较大的情况。
结合第一方面,在第一方面的某些实现方式中,所述压缩域语法元素包括:编码比特量、运动矢量和残差系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣耀终端有限公司,未经荣耀终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310043284.1/2.html,转载请声明来源钻瓜专利网。