[发明专利]视频处理方法及装置、电子设备和存储介质在审
申请号: | 202111483515.8 | 申请日: | 2021-12-07 |
公开(公告)号: | CN114202562A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 许通达;高宸健;王岩;袁涛;秦红伟 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06T7/13;G06V20/40;G06V10/40;G06V10/44;G06V10/62;G06V10/82 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 处理 方法 装置 电子设备 存储 介质 | ||
本公开涉及一种视频处理方法及装置、电子设备和存储介质,所述方法包括:获取第一视频帧,以及第一视频帧和第二视频帧之间的第一运动向量;获取目标对象在第一视频帧中的轮廓关键点的第一位置信息,以及第一视频帧的第一掩膜图像;根据第一运动向量、第一位置信息和第一掩膜图像,获得第二运动向量;根据第二运动向量和第一位置信息,获得目标对象在第二视频帧中的轮廓关键点的第二位置信息。根据本公开的实施例的视频处理方法,可通过对第一视频帧本身进行目标对象的识别处理,可获得目标对象的准确的轮廓,并可利用运动向量来进行后续视频帧中的目标检测,可利用视频帧的时间冗余,提升目标检测速度。
技术领域
本公开涉及计算机技术领域,尤其涉及一种视频处理方法及装置、电子设备和存储介质。
背景技术
对视频进行快速目标检测在视频处理与传输中有着重要应用。视频编码中可根据目标检测结果分配码率,解决存储成本。视频通信中可根据目标检测结果选择性传输,节约带宽成本,降低延迟。
当前的快速视频目标检测方法有两大分类,一类为单帧加速类,此方法需逐帧进行特征提取(feature extraction),并未利用视频帧的时间冗余(temporal redundancy),仍有较大的加速空间。
另一类为特征域变换加速类,此方法基于压缩视频码流(compressed bitstream)中的运动向量信息,检测视频帧的特征信息中的目标,由此利用视频帧的时间冗余,达到加速检测和/或分割任务的目的,但方法的变换属于特征域变换(feature wrapping),即,对经过卷积、下采样等处理后的特征信息进行变换等处理来检测目标,难以准确估计物体轮廓线(contour)。
发明内容
本公开提出了一种视频处理方法及装置、电子设备和存储介质。
根据本公开的一方面,提供了一种视频处理方法,包括:获取待处理视频流中的第一视频帧,以及所述第一视频帧和第二视频帧之间的第一运动向量,其中,所述第二视频帧为第一视频帧之后的任意视频帧;对所述第一视频帧中的目标对象进行检测处理,获取所述目标对象在第一视频帧中的轮廓关键点的第一位置信息,以及所述第一视频帧的第一掩膜图像,其中,所述第一掩膜图像为表示所述第一视频帧中目标对象的位置和轮廓的图像,所述轮廓关键点位于所述轮廓上;根据所述第一运动向量、所述第一位置信息和所述第一掩膜图像,获得第二运动向量,其中,所述第二运动向量为修正后的运动向量;根据所述第二运动向量和所述第一位置信息,获得所述目标对象在第二视频帧中的轮廓关键点的第二位置信息。
根据本公开的实施例的视频处理方法,可通过对第一视频帧本身进行目标对象的识别处理,可获得目标对象的准确的轮廓,并可利用运动向量来进行后续视频帧中的目标检测,可利用视频帧的时间冗余,提升目标检测速度,即,无需逐帧进行目标检测,而是可利用视频帧之间稀疏的运动向量信息来获取其他视频帧中目标对象的检测结果,提升检测效率。并且,通过修正后的运动向量来进行目标检测,可减小运动向量的累计误差,提升目标检测的准确性和鲁棒性。
在一种可能的实现方式中,根据所述第一运动向量、所述第一位置信息和所述第一掩膜图像,获得第二运动向量,包括:根据所述第一运动向量,获得分量特征图,所述分量特征图由第一运动向量的分量确定;将所述分量特征图、所述第一位置信息和所述第一掩膜图像输入修正神经网络,获得运动向量修正量;根据所述运动向量修正量和所述第一运动向量,获得所述第二运动向量。
在一种可能的实现方式中,根据所述第一运动向量,获得分量特征图,包括:将所述第一运动向量进行分解,获得第一维度分量和第二维度分量;根据所述第一维度分量和所述第二维度分量,分别获得分量特征图。
通过这种方式,可获得修正后的第二运动向量,修正处理可减小累计误差,修正轮廓关键点的位置,保持轮廓的形状。通过第二运动向量对第一视频帧中的轮廓关键点进行位置变换,可提升位置信息的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111483515.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:升降式自行车维修架
- 下一篇:一种基于织物传感器的儿童呼吸监控方法及系统