[发明专利]一种音频文件的声场分析方法及装置有效

申请号：	202210879403.2	申请日：	2022-07-25
公开（公告）号：	CN115240709B	公开（公告）日：	2023-09-19
发明（设计）人：	夏妍;林锋	申请（专利权）人：	镁佳(北京)科技有限公司
主分类号：	G10L25/24	分类号：	G10L25/24;G10L25/51
代理公司：	北京三聚阳光知识产权代理有限公司 11250	代理人：	胡晓静
地址：	100102 北京市朝阳***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频文件声场分析方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种音频文件的声场分析方法及装置，其中，音频文件的声场分析方法包括：获取待识别音频文件；将待识别音频文件划分为若干音频数据，并对每一音频数据进行合成器含量计算，得到合成器含量计算结果；对待识别音频文件进行伴奏人声比计算，得到伴奏人声比计算结果；判断合成器含量计算结果是否满足合成器含量阈值，以及伴奏人声比计算结果是否满足伴奏人声比阈值；当合成器含量计算结果、伴奏人声比计算结果分别满足各自阈值时，判定待识别音频文件的声场属性为声场窄。在准确计算得到合成器含量以及伴奏人声比的同时，还可以将音频文件的空间感进行有效表征，进而通过音频文件的内在属性对音频文件的调节进行准确指导。

技术领域

本发明涉及多媒体音频识别领域，具体涉及一种音频文件的声场分析方法及装置。

背景技术

多媒体音频文件的出现，极大地丰富了人们的日常生活，随着用户对于个性化选择的需求急速增加，如何对音频文件进行针对性的调节成为研究人员关注的重点。声音可以被人所评价的一般包括两个方面，包括音质音色和空间印象，其中，音质是基础，如果播放设备本身的音质不好，那么即便决定空间印象的客观参数没有区别，主观上也会觉得声场变差了，但相关实验表明，声音听起来是否自然(即“自然感”)有一半的权重都与空间印象也就是声场和声像有关，而声音听起来是否舒服——(即“愉悦感”)则一多半都与空间印象有关。目前对于音频文件的调节，多是通过调整播放设备的参数的方式使其达到理想播放效果，但这种调节方式往往忽略了音频文件的声场宽度属性特征，无法对音频文件的音效调节做出更好地指导。

发明内容

因此，本发明要解决的技术问题在于克服现有技术中的无法对音频文件的声场宽度进行准确判断，导致无法对调节音频文件进行准确指导的缺陷，从而提供一种音频文件的声场分析方法及装置。

根据第一方面，本发明实施例提供了一种音频文件的声场分析方法，所述方法包括：

获取待识别音频文件；

将所述待识别音频文件划分为若干音频数据，并对每一音频数据进行合成器含量计算，得到合成器含量计算结果；

对所述待识别音频文件进行伴奏人声比计算，得到伴奏人声比计算结果；

判断所述合成器含量计算结果是否满足合成器含量阈值，以及所述伴奏人声比计算结果是否满足伴奏人声比阈值；

当所述合成器含量计算结果满足所述合成器含量阈值且所述伴奏人声比计算结果满足所述伴奏人声比阈值时，判定所述待识别音频文件的声场属性为声场窄。

可选地，所述将所述待识别音频文件划分为若干音频数据，包括：

对所述待识别音频文件进行划分，得到若干中间音频数据；

对每一中间音频数据进行梅尔标度处理，得到各所述中间音频数据的梅尔谱图数据。

可选地，所述对每一音频数据进行合成器含量计算，得到合成器含量计算结果，包括：