[发明专利]一种镜头边界检测的方法、模型训练方法以及相关装置在审
申请号: | 201910549556.9 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110263729A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 胡东方 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 镜头类型 镜头边界 检测 视频 图像变化 镜头边界检测 镜头变化 模型训练 视频片段 申请 相邻图像帧 相关装置 相邻两帧 学习算法 漏检率 减小 图像 统计 | ||
本申请公开了一种镜头边界检测的方法,包括:获取待检测视频,待检测视频包括至少一个视频片段;获取待检测视频中视频片段对应的镜头类型,镜头类型为第一镜头类型或者第二镜头类型;若镜头类型属于第一镜头类型,则确定待检测视频所对应的图像变化值,其中,图像变化值为对待检测视频中相邻两帧图像进行计算后得到的;根据图像变化值确定待检测视频的镜头边界信息,其中,镜头边界信息包括镜头变化类型以及镜头变化位置。本申请还公开一种模型训练方法及装置。本申请结合深度学习算法以及相邻图像帧统计的方法,能够为镜头边界的检测提供更丰富的信息,从而减小镜头边界的漏检率,提升镜头边界的检测效果。
技术领域
本申请涉及人工智能领域,尤其涉及一种镜头边界检测的方法、模型训练方法以及相关装置。
背景技术
镜头边界检测的基础在于,同一个镜头内的视觉内容相近,而不同镜头间的视频内容差异大,且特征区别明显。视频的镜头变化主要分为突变(cut)和渐变(gradual)两种类型,突变是前一个镜头的末帧没有过渡地紧接着下一个镜头的首帧,而渐变是值在一段时间内逐渐完成镜头的变换,一般持续几帧到十几帧。
目前,传统的镜头检测算法通常是对视频内容的变化进行分析,比如获取图像强度的变化情况,根据图像强度的变化检测出视频中的镜头边界。又比如基于直方图来分析得到视频中的镜头边界。
然而,现有的镜头检测算法对渐变镜头的漏检率很高,而对于突变镜头而言,如果两侧的镜头颜色内容比较相似,也容易被误认为是相同镜头,从而导致镜头边界的检测效果较差。
发明内容
本申请实施例提供了一种镜头边界检测的方法、模型训练方法以及相关装置,结合深度学习算法以及相邻图像帧统计的方法,能够为镜头边界的检测提供更丰富的信息,从而减小镜头边界的漏检率,提升镜头边界的检测效果。
有鉴于此,本申请第一方面提供一种镜头边界检测的方法,包括:
获取待检测视频,其中,所述待检测视频包括至少一个视频片段,所述一个视频片段包括多帧连续的图像;
获取所述待检测视频中视频片段对应的镜头类型,其中,所述镜头类型为第一镜头类型或者第二镜头类型,所述第一镜头类型表示具有变化的镜头,所述第二镜头类型表示不具有变化的镜头;
若所述镜头类型属于所述第一镜头类型,则确定所述待检测视频中视频片段对应的图像变化值,其中,所述图像变化值为对所述待检测视频中视频片段内相邻两帧图像进行计算后得到的;
根据所述图像变化值确定所述待检测视频中视频片段的镜头边界信息,其中,所述镜头边界信息包括镜头变化类型以及镜头变化位置。
本申请第二方面提供一种模型训练的方法,包括:
获取待训练视频片段集合,其中,所述待训练视频片段集合包括至少一个待训练视频片段;
获取所述待训练视频片段集合中每个待训练视频片段所对应的预测镜头类型,其中,所述预测镜头类型为第一镜头类型或者第二镜头类型,所述第一镜头类型表示具有变化的镜头,所述第二镜头类型表示不具有变化的镜头;
根据所述每个待训练视频片段所对应的预测镜头类型以及真实镜头类型,采用损失函数对所述待训练镜头边界预测模型进行训练,得到模型参数,其中,所述真实镜头类型为预先对待训练视频片段进行标注后得到的;
根据所述模型参数生成镜头边界预测模型。
本申请第三方面提供一种镜头边界检测装置,包括:
获取模块,用于获取待检测视频,其中,所述待检测视频包括至少一个视频片段,所述一个视频片段包括多帧连续的图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910549556.9/2.html,转载请声明来源钻瓜专利网。