[发明专利]视频分类方法、装置、电子设备及存储介质在审
申请号: | 202010449857.7 | 申请日: | 2020-05-25 |
公开(公告)号: | CN113722539A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 王思聪;司建锋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种视频分类方法、装置、电子设备及存储介质,属于多媒体技术领域。方法包括:将从目标视频中获取到的至少一个图像帧输入基于卷积神经网络的运算模型,得到至少一个图像帧向量;从至少两个簇中确定该至少一个图像帧向量分别对应的目标簇,一个簇用于表示一类图像帧向量;基于至少一个图像帧向量分别对应的目标簇,获取目标视频对应的待识别文本;将待识别文本输入自然语言处理模型,通过自然语言处理模型对待识别文本进行解码,得到目标视频所属的视频类型。上述方案,在对目标视频进行分类时,将处理目标视频中的图像帧转换为处理待识别文本中的文本内容,降低了计算复杂度,缩短了处理时间,降低了对设备处理能力的要求。
技术领域
本申请涉及多媒体技术领域,特别涉及一种视频分类方法、装置、电子设备及存储介质。
背景技术
随着多媒体技术的发展,各种各样的视频网站层出不穷,而用户也越来越喜欢在空闲时间去各视频网站观看自己感兴趣的视频。对于视频网站来说,由于视频的数量庞大,且不同用户感兴趣的视频也不同,为了使用户能够在短时间内找到自己感兴趣的视频,视频网站通常会给视频进行分类或者添加标签,以表明该视频的主要内容,方便用户进行选择。
相关技术中,通常是采用深度学习的方法,通过卷积神经网络(CNN,Convolutional Neural Networks)或者长短期记忆网络(LSTM,Long Short-Term Memory)等模型,根据视频中包括的各图像帧对应的图片向量来确定各图像帧分别所属的类型,从而实现对视频进行分类或者添加标签的目的。
由于图片向量的维度较大,使得上述技术方案在对图像帧进行处理时,计算复杂度较高,从而需要耗费较长的时间,且对设备的处理能力要求较高。
发明内容
本申请实施例提供了一种视频分类方法、装置、电子设备及存储介质,用一维的簇心标识来取代高维的图像向量降低了计算复杂度,缩短了处理时间,降低了对设备处理能力的要求。所述技术方案如下:
一方面,提供了一种视频分类方法,所述方法包括:
将从目标视频中获取到的至少一个图像帧输入基于卷积神经网络的运算模型,得到至少一个图像帧向量;
从至少两个簇中确定所述至少一个图像帧向量分别对应的目标簇,一个簇用于表示一类图像帧向量;
基于所述至少一个图像帧向量分别对应的目标簇,获取所述目标视频对应的待识别文本;
将所述待识别文本输入自然语言处理模型,通过所述自然语言处理模型对所述待识别文本进行解码,得到所述目标视频所属的视频类型。
另一方面,提供了一种视频分类装置,所述装置包括:
向量获取模块,用于将从目标视频中获取到的至少一个图像帧输入基于卷积神经网络的运算模型,得到至少一个图像帧向量;
确定模块,用于从至少两个簇中确定所述至少一个图像帧向量分别对应的目标簇,一个簇用于表示一类图像帧向量;
文本获取模块,用于基于所述至少一个图像帧向量分别对应的目标簇,获取所述目标视频对应的待识别文本;
模型处理模块,用于将所述待识别文本输入自然语言处理模型,通过所述自然语言处理模型对所述待识别文本进行解码,得到所述目标视频所属的视频类型。
在一种可选的实现方式中,所述确定模块,还用于对于所述至少一个图像帧向量中的任一图像帧向量,从所述至少两个簇中确定簇心向量与所述图像帧向量之间相似度最高的簇作为所述图像帧向量的目标簇。
在一种可选的实现方式中,所述确定模块,还用于分别确定所述图像帧向量与所述至少两个簇的簇心向量之间的欧式距离;响应于任一簇的簇心向量与所述图像帧向量之间的欧式距离最小,将所述簇作为所述图像帧向量的目标簇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010449857.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:棱镜组件、发光装置和投影系统
- 下一篇:幕布的制备方法、装置、设备及存储介质