[发明专利]一种视频场景划分方法、装置、设备及介质有效
申请号: | 201910804662.7 | 申请日: | 2019-08-28 |
公开(公告)号: | CN110619284B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 胡东方 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/762 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 场景 划分 方法 装置 设备 介质 | ||
本申请公开了一种视频场景划分方法、装置、设备及介质,应用于视频处理技术领域,用以提高视频场景划分的精确度和效率。具体为:对视频进行镜头切分,得到镜头集合;将镜头集合中每相邻的两个镜头划分为一个场景检测单位,得到各个场景检测单位;分别对各个场景检测单位中的两个镜头进行聚类,得到各个场景检测单位各自对应的聚类结果;根据各个场景检测单位各自对应的聚类结果,对镜头集合中属于同一个场景的各个镜头进行合并,得到各个合并镜头;根据各个合并镜头和镜头集合中的各个未合并镜头,得到各个视频场景。这样,通过镜头切分、聚类和合并即可实现对视频场景的划分,操作相对简单,场景划分的效率和准确度较高,而且,通用性较强。
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频场景划分方法、装置、 设备及介质。
背景技术
近年来,随着网络技术和多媒体技术的不断发展,视频网站已经快速融入 到人们的日常生活,随之而来的是大量视频在互联网中涌现,视频可以说是信 息量最为丰富的重要媒介。
一般而言,根据视频内容粒度由粗到细的顺序,视频可以划分为场景、镜 头和图像三个层次,其中,场景作为有相对完整的故事情节的视频片段,是分 析与理解视频的关键,进而视频场景的划分逐渐成为视频处理技术领域较为热 门的研究方向。
然而,由于视频内容的多样性和复杂性,目前还没有一种通用且有效的视 频场景划分方法,如何提高视频场景划分的精确度和效率是视频处理技术领域 需要解决的一个问题。
发明内容
本申请实施例提供了一种视频场景划分方法、装置、设备及介质,用以提 高视频场景划分的精确度和效率。
本申请实施例提供的技术方案如下:
一方面,本申请实施例提供了一种视频场景划分方法,包括:
对视频进行镜头切分,得到视频对应的镜头集合;
将镜头集合中每相邻的两个镜头划分为一个场景检测单位,得到镜头集合 对应的各个场景检测单位;
分别对各个场景检测单位中的两个镜头进行聚类,得到各个场景检测单位 各自对应的聚类结果,其中,场景检测单位对应的聚类结果表征场景检测单位 中的两个镜头是否属于同一个场景;
根据各个场景检测单位各自对应的聚类结果,对镜头集合中属于同一个场 景的各个镜头进行合并,得到各个合并镜头;
根据各个合并镜头和镜头集合中的各个未合并镜头,得到视频对应的各个 视频场景。
在一种可能的实施方式中,分别对各个场景检测单位中的两个镜头进行聚 类,得到各个场景检测单位各自对应的聚类结果,包括:
针对每一个场景检测单位,获取场景检测单位中的两个镜头各自对应的目 标图像序列,分别对两个镜头各自对应的目标图像序列进行图像特征提取,得 到两个镜头各自对应的图像特征数据,基于两个镜头各自对应的图像特征数据, 利用图像聚类模型,获得场景检测单位对应的图像聚类结果;
和/或;
针对每一个场景检测单位,获取场景检测单位中的两个镜头各自对应的目 标语音信号,分别将两个镜头各自对应的目标语音信号转化为文本向量,基于 两个镜头各自对应的文本向量,并利用文本聚类模型,获得场景检测单位对应 的文本聚类结果;
分别将各个场景检测单位各自对应的图像聚类结果和/或文本聚类结果,确 定为各个场景检测单位各自对应的聚类结果。
在一种可能的实施方式中,获取场景检测单位中的两个镜头各自对应的目 标图像序列,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910804662.7/2.html,转载请声明来源钻瓜专利网。