[发明专利]媒体数据处理方法、装置及存储介质有效
申请号: | 201911259316.1 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111090758B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 缪畅宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/45 | 分类号: | G06F16/45;G06F16/48;G10L25/27 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体 数据处理 方法 装置 存储 介质 | ||
1.一种媒体数据处理方法,其特征在于,所述方法包括:
对待处理的音频信号进行分组,得到多个时间序列分组;
将所述多个时间序列分组中的每个时间序列分组变换成频域序列,并对所述频域序列进行采样,得到多个频域向量;
分别对所述多个时间序列分组沿着时间序列方向进行时域特性处理操作,以及对所述多个频域向量沿着频率方向进行频域特性处理操作;
根据所述多个时间序列分组的时域特性处理操作结果和所述多个频域向量的频域特性处理操作结果,对所述音频信号进行分类,得到所述音频信号的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述时域特性处理操作包括卷积操作,所述对所述多个时间序列分组沿着时间序列方向进行时域特性处理操作,包括:
利用时域卷积核与所述多个时间序列分组进行卷积操作,得到时域卷积向量,其中,所述时域卷积向量包括多个元素,所述时域卷积向量的每个元素用于表示进行卷积前与一个时域卷积核大小对应的多个时间序列分组之间的关联关系,所述时域卷积核的行向量的大小与所述多个频域向量的大小相同,所述时域卷积核的列向量的大小为自定义的。
3.根据权利要求2所述的方法,其特征在于,所述时域特性处理操作包括池化操作,所述对所述多个时间序列分组沿着时间序列方向进行时域特性处理操作,包括:
对所述多个时间序列分组或所述时域卷积向量进行池化操作,得到时域池化向量,其中,所述时域池化向量包括一个元素,所述时域池化向量的元素用于表示所述多个时间序列分组或所述时域卷积向量的浓缩特性。
4.根据权利要求1所述的方法,其特征在于,所述频域特性处理操作包括卷积操作,所述对所述多个频域向量沿着频率方向进行频域特性处理操作,包括:
利用频域卷积核与所述多个频域向量进行卷积操作,得到频域卷积向量,其中,所述频域卷积向量包括多个元素,所述频域卷积向量的每个元素用于表示进行卷积前与一个频域卷积核大小对应的多个频域向量之间的关联关系,所述频域卷积核的列向量的大小与所述多个频域向量的大小相同,所述频域卷积核的行向量的大小为自定义的。
5.根据权利要求4所述的方法,其特征在于,所述频域特性处理操作包括卷积操作,所述对所述多个频域向量沿着频率方向进行频域特性处理操作,包括:
对所述多个频域向量或所述频域卷积向量进行池化操作,得到频域池化向量,其中,所述频域池化向量包括一个元素,所述频域池化向量的元素用于表示所述多个频域向量或所述频域卷积向量的浓缩特性。
6.根据权利要求1所述的方法,其特征在于,所述根据所述多个时间序列分组的时域特性处理操作结果和所述多个频域向量的频域特性处理操作结果,对所述音频信号进行分类,得到所述音频信号的分类结果,包括:
将所述时域特性处理操作结果和所述频域特性处理操作结果拼接成一个特性向量;
将所述拼接的特性向量输入分类器,对所述音频信号进行分类,得到所述音频信号的分类结果。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收服务器的召回指示,所述召回指示用于指示召回媒体数据,所述召回指示包括参考媒体数据;
获取所述参考媒体数据的时域特性和频域特性;
将所述音频信号的时域特性与所述参考媒体数据的时域特性进行比较,以及将所述音频信号的频域特性与所述参考媒体数据的频域特性进行比较;
若所述音频信号的时域特性与所述参考媒体数据的时域特性的相似度大于或等于第一设定值,和/或所述音频信号的频域特性与所述参考媒体数据的频域特性的相似度大于或等于第二设定值,删除所述音频信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911259316.1/1.html,转载请声明来源钻瓜专利网。