[发明专利]视频特征提取方法、装置、计算机设备和存储介质在审
申请号: | 202111408061.8 | 申请日: | 2021-11-24 |
公开(公告)号: | CN114329070A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 李传俊;许有疆;胡智超 | 申请(专利权)人: | 腾讯科技(武汉)有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06V20/40;G06V10/762;G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 唐彩琴 |
地址: | 430000 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 特征 提取 方法 装置 计算机 设备 存储 介质 | ||
1.一种视频特征提取方法,其特征在于,所述方法包括:
获取视频数据;
对所述视频数据进行拆解,得到与所述视频数据对应的拆分数据,所述拆分数据包括视频帧集合以及视频片段集合;
对所述视频帧集合中视频帧进行帧特征提取,得到视觉特征信息,并对所述视频片段集合中视频片段进行片段特征提取,得到片段特征信息;
在视频帧个数维度上对所述视觉特征信息进行卷积,得到第一特征信息;
在视频片段数维度上对所述片段特征信息进行卷积,得到第二特征信息;
根据所述第一特征信息和所述第二特征信息,得到视频特征信息。
2.根据权利要求1所述的方法,其特征在于,所述在视频帧个数维度上对所述视觉特征信息进行卷积,得到第一特征信息包括:
在视频帧个数维度上,根据多个预设卷积核,分别对所述视觉特征信息进行卷积,得到与所述预设卷积核对应的第一卷积特征信息;
拼接所述第一卷积特征信息,并对拼接后的第一卷积特征信息进行特征聚合,得到第一特征信息。
3.根据权利要求1所述的方法,其特征在于,所述在视频片段数维度上对所述片段特征信息进行卷积,得到第二特征信息包括:
在视频片段数维度上,根据多个预设卷积核,分别对所述片段特征信息进行卷积,得到与所述预设卷积核对应的第二卷积特征信息;
拼接所述第二卷积特征信息,并对拼接后的第二卷积特征信息进行特征聚合,得到第二特征信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征信息和所述第二特征信息,得到视频特征信息包括:
拼接所述第一特征信息和所述第二特征信息,得到拼接特征信息,所述拼接特征信息包括多通道特征信息;
确定所述拼接特征信息中各通道对应的加权参数;
根据所述加权参数,对所述多通道特征信息进行更新,得到更新后的拼接特征信息;
根据更新后的拼接特征信息,得到视频特征信息。
5.根据权利要求1所述的方法,其特征在于,所述拆分数据还包括音频片段集合以及视频文本数据;
所述视频特征提取方法还包括:
对所述音频片段集合中音频片段进行音频特征提取,得到音频特征信息;
在音频片段数维度上对所述音频特征信息进行卷积,得到第三特征信息;
对所述视频文本数据进行文本特征提取,得到第四特征信息;
所述根据所述第一特征信息和所述第二特征信息,得到视频特征信息包括:
拼接所述第一特征信息、所述第二特征信息、所述第三特征信息和所述第四特征信息,得到视频特征信息。
6.根据权利要求5所述的方法,其特征在于,所述在音频片段数维度上对所述音频特征信息进行卷积,得到第三特征信息包括:
在音频片段数维度上,根据多个预设卷积核,分别对所述音频特征信息进行卷积,得到与预设卷积核对应的第三卷积特征信息;
拼接所述第三卷积特征信息,并对拼接后的第三卷积特征信息进行特征聚合,得到第三特征信息。
7.根据权利要求5所述的方法,其特征在于,所述对所述视频文本数据进行文本特征提取,得到第四特征信息包括:
提取所述视频文本数据中每段文本数据的文本特征;
对所述文本特征进行特征维度转换,得到第四特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(武汉)有限公司,未经腾讯科技(武汉)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111408061.8/1.html,转载请声明来源钻瓜专利网。