[发明专利]视频聚类方法、装置、存储介质和电子设备在审
申请号: | 202011016809.5 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112131430A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 费志辉;马连洋;衡阵 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/78;G06F40/30;G06F40/289;G06N3/04 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 方法 装置 存储 介质 电子设备 | ||
本申请提供一种视频聚类方法、装置、存储介质和电子设备,属于计算机技术领域,涉及人工智能和自然语言处理技术。其中,视频聚类方法包括:获取待聚类的视频数据集中每个视频的视频标题,根据每个视频标题的语义特征对应的特征向量,对视频进行聚类处理,得到多个视频集合。与相关技术中对视频中的多个图像帧进行处理相比,该方法对视频的视频标题进行处理,运算量小,处理速度快,效率高。而且,由于视频标题可以表征视频的内容信息,因此视频标题的特征向量可以准确地表达视频的内容特征,基于视频标题的特征向量,对视频进行聚类处理,可以提高聚类结果的准确度。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种视频聚类方法、装置、存储介质和电子设备。
背景技术
随着人们精神文化需求的不断增加,各种视频资源不断丰富,例如,创作者每天通过互联网平台发布的短视频可达几十万条。用户在观看视频时,需要在海量的视频资源中查找感兴趣的视频,需要花费大量的时间。
为了便于对海量的视频进行管理,以及减少用户在查找感兴趣的视频时所用的时间,可以对视频进行聚类,为属于同一类别的视频设置相同的类别标签,例如,为一些美食类视频设置“美食”标签,为一些军事类视频设置“军事”标签等。
目前,在对视频进行聚类时,通常先从视频中的抽取关键图像帧,然后根据关键图像帧中的图像特征对视频进行聚类,得到聚类结果。该方法对视频中的多个图像帧进行处理,运算量大,处理过程复杂,效率低。而且在确定关键图像帧及关键图像帧中的图像特征时容易出现错误判定,影响聚类结果的准确度。
发明内容
为解决现有存在的技术问题,本申请实施例提供一种视频聚类方法、装置、存储介质和电子设备,可以提高视频聚类的效率和准确度。
为达到上述目的,本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供了一种视频聚类方法,所述方法包括:
获取待聚类的视频数据集中每个视频的视频标题;
对每个视频标题进行语义特征提取,得到每个视频标题的特征向量;
根据得到的每个视频标题的特征向量,对所述视频数据集中的每个视频进行聚类处理,得到多个视频集合;每个视频集合中的视频属于同一类别。
第二方面,本申请实施例还提供了一种视频聚类装置,所述装置包括:
标题获取单元,用于获取待聚类的视频数据集中每个视频的视频标题;
特征提取单元,用于对每个视频标题进行语义特征提取,得到每个视频标题的特征向量;
视频聚类单元,用于根据得到的每个视频标题的特征向量,对所述视频数据集中的每个视频进行聚类处理,得到多个视频集合;每个视频集合中的视频属于同一类别。
在一种可选的实施例中,所述特征提取单元,具体用于:
将每个视频标题分别输入已训练的语义特征提取模型,得到每个视频标题的特征向量;所述语义特征提取模型是采用已标注类别标签的视频标题样本作为训练数据进行训练得到的。
在一种可选的实施例中,所述装置还包括模型训练单元,用于:
获取训练数据集,所述训练数据集中包括多个视频标题样本,每个视频标题样本均具有对应的类别标签,所述类别标签用于标识所述视频标题样本对应的视频所属的类别;
从训练数据集中抽取视频标题样本;
将抽取的视频标题样本输入待训练的语义特征提取模型,得到视频标题样本的特征向量;
将视频标题样本的特征向量输入分类网络,得到所述分类网络输出的视频标题样本的类别预测结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011016809.5/2.html,转载请声明来源钻瓜专利网。