[发明专利]视频分类方法、装置及服务器有效
申请号: | 202010207957.9 | 申请日: | 2018-12-14 |
公开(公告)号: | CN111428088B | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 屈冰欣;郑茂 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 装置 服务器 | ||
本申请公开了一种视频分类方法、装置及服务器。该方法包括:获取目标视频;通过第一分类模型对目标视频中的图像帧进行分类,得到图像分类结果,第一分类模型用于基于图像帧的图像特征进行分类;通过第二分类模型对目标视频中的音频进行分类,得到音频分类结果,第二分类模型用于基于音频的音频特征进行分类;通过第三分类模型对目标视频对应的文本描述信息进行分类,得到文本分类结果,第三分类模型用于基于文本描述信息的文本特征进行分类;根据图像分类结果、音频分类结果和文本分类结果,确定目标视频的目标分类结果。本申请中,综合图像特征、音频特征以及文本特征进行分类,充分考虑视频不同维度的特征,提高了视频分类的准确性。
本申请是申请号为201811535837.0、申请日为2018年12月14日、发明名称为“视频分类方法、装置及服务器”的发明专利的分案申请。
技术领域
本申请实施例涉及视频分类领域,特别涉及一种视频分类方法、装置及服务器。
背景技术
推荐功能是视频类应用程序中常见的功能,用于向用户推荐其感兴趣的视频,而推荐功能的优劣与视频分类的准确性密切相关。
相关技术中,采用基于图像识别的方式对视频进行分类。在一种基于图像识别的视频分类方法中,通过抽取视频中的图像帧,并提取图像帧的图像特征,从而按照图像帧的时序,将图像特征输入长短期记忆(Long Short-Term Memory, LSTM)网络,进而根据LSTM网络的输出确定视频分类。
然而,基于图像特征进行视频分类时,由于特征维度单一,导致视频分类效果不佳。
发明内容
本申请实施例提供了一种视频分类方法、装置及服务器,可以解决基于图像特征进行视频分类时,由于特征维度单一,导致视频分类效果不佳。所述技术方案如下:
一方面,提供了一种视频分类方法,所述方法包括:
获取目标视频;
通过第一分类模型对所述目标视频中的图像帧进行分类,得到图像分类结果,所述第一分类模型用于基于所述图像帧的图像特征进行分类;
通过第二分类模型对所述目标视频中的音频进行分类,得到音频分类结果,所述第二分类模型用于基于所述音频的音频特征进行分类;
通过第三分类模型对所述目标视频对应的文本描述信息进行分类,得到文本分类结果,所述第三分类模型用于基于所述文本描述信息的文本特征进行分类;
根据所述图像分类结果、所述音频分类结果和所述文本分类结果,确定所述目标视频的目标分类结果。
另一方面,提供了一种视频分类装置,其特征在于,所述装置包括:
视频获取模块,用于获取目标视频;
第一分类模块,用于通过第一分类模型对所述目标视频中的图像帧进行分类,得到图像分类结果,所述第一分类模型用于基于所述图像帧的图像特征进行分类;
第二分类模块,用于通过第二分类模型对所述目标视频中的音频进行分类,得到音频分类结果,所述第二分类模型用于基于所述音频的音频特征进行分类;
第三分类模块,用于通过第三分类模型对所述目标视频对应的文本描述信息进行分类,得到文本分类结果,所述第三分类模型用于基于所述文本描述信息的文本特征进行分类;
目标分类模块,用于根据所述图像分类结果、所述音频分类结果和所述文本分类结果,确定所述目标视频的目标分类结果。
另一方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器执行以实现如上述方面所述的视频分类装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010207957.9/2.html,转载请声明来源钻瓜专利网。