[发明专利]音质比较方法、装置、电子设备及存储介质有效
申请号: | 201910233933.8 | 申请日: | 2019-03-26 |
公开(公告)号: | CN109961802B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 张晨 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音质 比较 方法 装置 电子设备 存储 介质 | ||
1.一种音质比较方法,其特征在于,包括:
对多个音频进行特征提取,得到每个音频的音频特征;
对所述多个音频的音频特征进行组合,得到所述多个音频的一个联合特征;
调用音质比较模型,所述音质比较模型用于确定所述联合特征中多个音频特征对应的多个音频之间的音质关系,所述音质比较模型基于已知音质关系的多个样本音频的音频特征和不同的目标数组组合得到的多个联合特征训练得到,每个联合特征的目标音质比较结果与所述联合特征中的目标数组对应;
将所述联合特征输入所述音质比较模型中,输出所述多个音频的一个音质比较结果,所述音质比较结果用于指示所述多个音频之间的音质关系。
2.根据权利要求1所述的音质比较方法,其特征在于,所述对多个音频进行特征提取,得到每个音频的音频特征,包括:
对所述多个音频的音频信号进行分帧、加窗和傅里叶变换,得到每个音频的频域信号;
基于所述每个音频的频域信号和目标函数,获取所述每个音频的音频特征。
3.根据权利要求1所述的音质比较方法,其特征在于,所述对所述多个音频的音频特征进行组合,得到所述多个音频的联合特征,包括:
对所述多个音频的音频特征和目标数组进行组合,得到所述多个音频的联合特征,所述联合特征的维度的数量大于所述音频特征的维度的数量,所述目标数组用于表示所述多个音频的音频特征的组合顺序。
4.根据权利要求1所述的音质比较方法,其特征在于,所述音质比较模型的训练过程包括:
获取多个样本集合,每个样本集合中包括所述多个样本音频;
对所述多个样本集合中的所述多个样本音频进行特征提取,得到每个样本音频的音频特征;
对于所述每个样本集合中多个样本音频的音频特征,基于所述多个样本音频的音频特征和多个不同的目标数组,获取所述每个样本集合中多个样本音频的多个联合特征,每个联合特征的目标音质比较结果与所述联合特征中的目标数组对应;
调用初始模型,将所述多个样本集合的多个联合特征输入所述初始模型中,由所述初始模型对每个联合特征进行处理,得到每个联合特征对应的音质比较结果;
根据每个联合特征对应的音质比较结果和目标音质比较结果,获取所述每个联合特征对应的音质比较结果的准确性;
根据所述准确性,对所述初始模型的模型参数进行调整,直至满足目标条件时停止。
5.根据权利要求4所述的音质比较方法,其特征在于,所述每个联合特征的目标音质比较结果的获取过程包括:
根据所述每个联合特征中多个音频特征对应的样本音频的来源信息或标注信息,确定所述多个样本音频的音质关系;
根据所述每个联合特征中目标数组所表示的所述多个音频特征的组合顺序与所述多个样本音频的音质关系,确定所述每个联合特征的目标音质比较结果。
6.一种音质比较装置,其特征在于,包括:
特征提取模块,被配置为执行对多个音频进行特征提取,得到每个音频的一个音频特征;
特征组合模块,被配置为执行对所述多个音频的音频特征进行组合,得到所述多个音频的联合特征;
模型调用模块,被配置为执行调用音质比较模型,所述音质比较模型用于确定所述联合特征中多个音频特征对应的多个音频之间的音质关系,所述音质比较模型基于已知音质关系的多个样本音频的音频特征和不同的目标数组组合得到的多个联合特征训练得到,每个联合特征的目标音质比较结果与所述联合特征中的目标数组对应;
音质比较模块,用于将所述联合特征输入所述音质比较模型中,输出所述多个音频的一个音质比较结果,所述音质比较结果用于指示所述多个音频之间的音质关系。
7.根据权利要求6所述的音质比较装置,其特征在于,所述特征提取模块被配置为执行:
对所述多个音频的音频信号进行分帧、加窗和傅里叶变换,得到每个音频的频域信号;
基于所述每个音频的频域信号和目标函数,获取所述每个音频的音频特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910233933.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:智能服务评价方法、计算机可读存储介质和终端设备
- 下一篇:语音情绪识别系统